Автоматизация научных исследований в машинном обучении (практика, В.В. Стрижов)/ФУПМ, осень 2019

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Занятие 2 (13-18 сентября))
Строка 20: Строка 20:
## Нарисовать дисперсию прогноза ([https://nbviewer.jupyter.org/github/Intelligent-Systems-Phystech/StartCode/blob/master/Kachkov2018LateProblem2/LateProblem2.ipynb пример полосы]). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
## Нарисовать дисперсию прогноза ([https://nbviewer.jupyter.org/github/Intelligent-Systems-Phystech/StartCode/blob/master/Kachkov2018LateProblem2/LateProblem2.ipynb пример полосы]). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
## Дополнительно*: предложить способ порождения новых (признаков) моделей.
## Дополнительно*: предложить способ порождения новых (признаков) моделей.
-
'''Анкета'''
+
-
* [https://forms.gle/RCRs2RBJxP8Rv5vD6 Анкета "'''записаться на курс'''"] (стоит отдельно от основной по просьбе робота. Внимание работает только под @phystech.edu и только один раз)
+
-
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (стоит отдельно от основной. нужна для того, чтобы собрать название папок GitHub где Вы выполнили задание)
+
-
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (стоит отдельно от основной. нужна для того, чтобы собрать рецензии людей)
+
-
* [https://forms.gle/YyCBiD852y59QVdC7 Анкета с вопросами на повторение] (основная)
+
-
 
+
'''Материалы'''
'''Материалы'''
* [[Media:Strijov2019PS-Intro.pdf|Вводные слайды]]
* [[Media:Strijov2019PS-Intro.pdf|Вводные слайды]]
Строка 36: Строка 31:
*# '''No temporary''' nor dummy files
*# '''No temporary''' nor dummy files
Прочитать, чем '''[https://stackoverflow.com/questions/5009600/difference-between-fork-and-branch-on-github отличается branch от fork]'''
Прочитать, чем '''[https://stackoverflow.com/questions/5009600/difference-between-fork-and-branch-on-github отличается branch от fork]'''
 +
 +
'''Анкета'''
 +
* [https://forms.gle/RCRs2RBJxP8Rv5vD6 Анкета "'''записаться на курс'''"] (стоит отдельно от основной по просьбе робота. Внимание работает только под @phystech.edu и только один раз)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (стоит отдельно от основной. нужна для того, чтобы собрать название папок GitHub где Вы выполнили задание)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (стоит отдельно от основной. нужна для того, чтобы собрать рецензии людей)
 +
* [https://forms.gle/YyCBiD852y59QVdC7 Анкета с вопросами на повторение] (основная)
 +
== Занятие 2 (13-18 сентября) ==
== Занятие 2 (13-18 сентября) ==
Строка 42: Строка 44:
* hangouts для желающих задать вопрос устно
* hangouts для желающих задать вопрос устно
* если видео будет значимо отставать, то будет ссылка на телеграм для вопросов}}
* если видео будет значимо отставать, то будет ссылка на телеграм для вопросов}}
 +
 +
'''Задание'''
 +
# Загрузить выборку (прежнюю, из UCI, или на ваш вкус), нормировать признаки.
 +
# Для линейной модели (на выбор регрессии или классификации)
 +
## написать генетический алгоритм выбора признаков (или по вашему выбору)
 +
## построить графики зависимости
 +
## x-axis is iteration
 +
## y-axis is the error function S, train test, std
 +
## y-axis is “noodle” of the parameters, std
 +
## y-axis is the structure indicator function
 +
# Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.
 +
 +
 +
'''Материалы'''
 +
* [[Media:Strijov2019PS-Intro.pdf|Выбор признаков]]
 +
* [[Media:Strijov2019PS-Intro.pdf|Структура нейросети]]
 +
 +
'''Анкета'''
 +
* Ожидается

Версия 13:09, 13 сентября 2019


Дополнительные материалы находятся на основной странице
  • Короткий адрес этой страницы bit.ly/PS-ML


Занятие 1 (6-11 сентября)

  1. Подготовка инструментов: выполнить (или проверить, что владеете инструментом),
    • пункты 1, 2, 4, 6, 7, 9, 11, 12 ,13 ДЗ-1 из основной страницы,
    • пункты 4, 5 ДЗ-2.
  2. Получить доступ к https://github.com/Intelligent-Systems-Phystech/
  3. В папке 2019-StartCode создать папку ДЗ Surname2019Linear и файл main.ipynb
    1. В тетради кратко указать название и цель эксперимента.
    2. Загрузить выборку
      1. простую (цена на хлеб),
      2. посложнее (потребление электроэнергии),
      3. совет: лучше загружать по ссылке, а не сохранять в репозиторий.
    3. Построить несколько моделей (пример).
    4. Нарисовать график прогноза (оформление: пример 1, пример 2).
    5. Нарисовать дисперсию прогноза (пример полосы). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
    6. Дополнительно*: предложить способ порождения новых (признаков) моделей.

Материалы

Советы по пользованию репозиторием

  • GitHub: клонируйте мастер и заливайте правки в него, если работаете только со своим кодом. См. краткое руководство по работе с GitHub.
    1. Update first, Commit after (Pull first, Push after)
    2. Your own work only, no external publications
    3. No big files (put link to external datasets)
    4. No temporary nor dummy files

Прочитать, чем отличается branch от fork

Анкета


Занятие 2 (13-18 сентября)

Тут будут в пятницу в 18:35 ссылки на
  • видео-стрим семинара
  • hangouts для желающих задать вопрос устно
  • если видео будет значимо отставать, то будет ссылка на телеграм для вопросов


Задание

  1. Загрузить выборку (прежнюю, из UCI, или на ваш вкус), нормировать признаки.
  2. Для линейной модели (на выбор регрессии или классификации)
    1. написать генетический алгоритм выбора признаков (или по вашему выбору)
    2. построить графики зависимости
    3. x-axis is iteration
    4. y-axis is the error function S, train test, std
    5. y-axis is “noodle” of the parameters, std
    6. y-axis is the structure indicator function
  3. Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.


Материалы

Анкета

  • Ожидается
Личные инструменты