Автоматизация научных исследований в машинном обучении (практика, В.В. Стрижов)/ФУПМ, осень 2019

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Занятие 1 (6-11 сентября))
(Занятие 3 (20-25 сентября))
(36 промежуточных версий не показаны.)
Строка 1: Строка 1:
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}}
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}}
-
{{tip|Материалы по курсу находятся [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|на основной странице]]'''
+
{{tip|Дополнительные материалы находятся [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|на основной странице]]'''
* Короткий адрес этой страницы [http://bit.ly/PS-ML bit.ly/PS-ML]
* Короткий адрес этой страницы [http://bit.ly/PS-ML bit.ly/PS-ML]
}}
}}
== Занятие 1 (6-11 сентября) ==
== Занятие 1 (6-11 сентября) ==
-
# Подготовка инструментов: выполнить (или проверить, что владеете инструментом) .
+
# Подготовка инструментов: выполнить (или проверить, что владеете инструментом),
-
** пункты '''1, 2, 4, 6, 7, 9, 11, 12 ,13''' ДЗ-1 из основной страницы
+
#* пункты '''1, 2, 4, 6, 7, 9, 11, 12 ,13''' ДЗ-1 из основной страницы,
-
** пункты '''4, 5''' ДЗ-2.
+
#* пункты '''4, 5''' ДЗ-2.
# Получить доступ к [https://github.com/Intelligent-Systems-Phystech/ https://github.com/Intelligent-Systems-Phystech/]
# Получить доступ к [https://github.com/Intelligent-Systems-Phystech/ https://github.com/Intelligent-Systems-Phystech/]
-
# В папке [https://github.com/Intelligent-Systems-Phystech/StartCode StartCode] создать папку ДЗ '''Surname2019Linear''' и файл '''main.ipynb'''
+
# В папке [https://github.com/Intelligent-Systems-Phystech/2019-StartCode 2019-StartCode] создать папку ДЗ '''Surname2019Linear''' и файл '''main.ipynb'''
## В тетради кратко указать название и цель эксперимента.
## В тетради кратко указать название и цель эксперимента.
## Загрузить выборку
## Загрузить выборку
-
### простую
+
### [https://sourceforge.net/p/mvr/code/HEAD/tree/data/WhiteBreadPrices.csv?format=raw простую] (цена на хлеб),
-
### посложнее
+
### [https://sourceforge.net/p/mvr/code/HEAD/tree/data/EnergyConsumption.xls?format=raw посложнее] (потребление электроэнергии),
-
### совет: лучше загружать по ссылке, а не сохранять в репозитории.
+
### совет: лучше загружать по ссылке, а не сохранять в репозиторий.
-
## Построить несколько моделей (пример).
+
## Построить несколько моделей ([[Линейная регрессия (пример)|пример]]).
-
## Нарисовать график прогноза (пример оформления).
+
## Нарисовать график прогноза (оформление: [[JMLDA/Fig|пример 1]], [https://colab.research.google.com/drive/1Mv4CCAn7iRqs1BUR9zlQlu2lFqqpndST пример 2]).
-
## Нарисовать дисперсию прогноза (пример полосы).
+
## Нарисовать дисперсию прогноза ([https://nbviewer.jupyter.org/github/Intelligent-Systems-Phystech/StartCode/blob/master/Kachkov2018LateProblem2/LateProblem2.ipynb пример полосы]). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
-
### Дисперсия (в каждой точке прогноза) вычисляется путем случайного семплирования обучающей выборки.
+
## Дополнительно*: предложить способ порождения новых (признаков) моделей.
 +
 +
'''Материалы'''
 +
* [[Media:Strijov2019PS-Intro.pdf|Вводные слайды]]
 +
 
 +
'''Советы по пользованию репозиторием'''
 +
* GitHub: клонируйте '''мастер''' и заливайте правки в него, если работаете только со своим кодом. [https://github.com/Strijov/Strijov2018-1AutomationOfResearch/raw/master/GitHubSimplest.pdf См. краткое руководство по работе с GitHub].
 +
*# '''Update first''', Commit after (Pull first, Push after)
 +
*# '''Your own work only''', no external publications
 +
*# '''No big files''' (put link to external datasets)
 +
*# '''No temporary''' nor dummy files
 +
Прочитать, чем '''[https://stackoverflow.com/questions/5009600/difference-between-fork-and-branch-on-github отличается branch от fork]'''
'''Анкета'''
'''Анкета'''
 +
* [https://forms.gle/RCRs2RBJxP8Rv5vD6 Анкета "'''записаться на курс'''"] (стоит отдельно от основной по просьбе робота. Внимание работает только под @phystech.edu и только один раз)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (стоит отдельно от основной. нужна для того, чтобы собрать название папок GitHub где Вы выполнили задание)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (стоит отдельно от основной. нужна для того, чтобы собрать рецензии людей)
 +
* [https://forms.gle/YyCBiD852y59QVdC7 Анкета с вопросами на повторение] (основная)
 +
 +
 +
== Занятие 2 (13-18 сентября) ==
 +
{{tip| Тут будут '''в пятницу в 18:35''' ссылки на
 +
* [https://youtu.be/c7oTaoDgh4Y '''видео-стрим''' семинара]
 +
* [https://t.me/Qs_ML ссылка на телеграм для вопросов]}}
 +
 +
'''Задание'''
 +
# Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки.
 +
# Для линейной модели (на выбор: модель регрессии или классификации)
 +
#* написать генетический алгоритм выбора признаков (или другой, по вашему выбору).
 +
# Построить графики зависимости,
 +
## ось абсцисс: итерации, <!-- x-axis is iteration -->
 +
## ось ординат: функция ошибки ''S'' и ее стандартное отклонение (обучающая и тестовая выборка), <!-- y-axis is the error function S, train test, std-->
 +
## ось ординат: параметны модели "лапша" (желательно стандартное отклонение), <!-- y-axis is “noodle” of the parameters, std -->
 +
## дополнительно, ось ординат: структура модели, индикаторная вектор-функция. <!-- y-axis is the structure indicator function -->
 +
# Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.
'''Материалы'''
'''Материалы'''
-
* Слайды занятия 1.
+
* [[Media:Strijov2019FeatureSelection.pdf|Выбор признаков]]
 +
* [[Media:Strijov20192NNUniversalModel.pdf|Структура нейросети]]
 +
 
 +
'''Анкета'''
 +
* [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)
 +
 
 +
 
 +
== Занятие 3 (20-25 сентября) ==
 +
{{tip| Ссылки:
 +
* [видео-стрим семинара]
 +
* [https://t.me/Qs_ML телеграм для вопросов]}}
 +
 
 +
'''Задание'''
 +
# Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде:
 +
## название и ответы на пять вопросов (написать, от лица эксперта или аналитика),
 +
## схема в формате IDEF0.
 +
# Детализация проекта такова, что план понятен непосвященному читателю.
 +
 +
'''Материалы'''
 +
* [[Media:Strijov2019IDEF0.pdf|Стандарт IDEF при планировании проектов]]
 +
* [[Media:Strijov2019Autoencoder.pdf|Автоэнкодер и нейросеть]]
 +
 
 +
'''Анкета'''
 +
<!--- * [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)
 +
-->

Версия 20:25, 17 сентября 2019


Дополнительные материалы находятся на основной странице
  • Короткий адрес этой страницы bit.ly/PS-ML


Занятие 1 (6-11 сентября)

  1. Подготовка инструментов: выполнить (или проверить, что владеете инструментом),
    • пункты 1, 2, 4, 6, 7, 9, 11, 12 ,13 ДЗ-1 из основной страницы,
    • пункты 4, 5 ДЗ-2.
  2. Получить доступ к https://github.com/Intelligent-Systems-Phystech/
  3. В папке 2019-StartCode создать папку ДЗ Surname2019Linear и файл main.ipynb
    1. В тетради кратко указать название и цель эксперимента.
    2. Загрузить выборку
      1. простую (цена на хлеб),
      2. посложнее (потребление электроэнергии),
      3. совет: лучше загружать по ссылке, а не сохранять в репозиторий.
    3. Построить несколько моделей (пример).
    4. Нарисовать график прогноза (оформление: пример 1, пример 2).
    5. Нарисовать дисперсию прогноза (пример полосы). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
    6. Дополнительно*: предложить способ порождения новых (признаков) моделей.

Материалы

Советы по пользованию репозиторием

  • GitHub: клонируйте мастер и заливайте правки в него, если работаете только со своим кодом. См. краткое руководство по работе с GitHub.
    1. Update first, Commit after (Pull first, Push after)
    2. Your own work only, no external publications
    3. No big files (put link to external datasets)
    4. No temporary nor dummy files

Прочитать, чем отличается branch от fork

Анкета


Занятие 2 (13-18 сентября)

Тут будут в пятницу в 18:35 ссылки на


Задание

  1. Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки.
  2. Для линейной модели (на выбор: модель регрессии или классификации)
    • написать генетический алгоритм выбора признаков (или другой, по вашему выбору).
  3. Построить графики зависимости,
    1. ось абсцисс: итерации,
    2. ось ординат: функция ошибки S и ее стандартное отклонение (обучающая и тестовая выборка),
    3. ось ординат: параметны модели "лапша" (желательно стандартное отклонение),
    4. дополнительно, ось ординат: структура модели, индикаторная вектор-функция.
  4. Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.

Материалы

Анкета

  • Анкета с вопросами (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
  • Анкета "сдача задания" (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
  • Анкета "рецензия" (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)


Занятие 3 (20-25 сентября)

Ссылки:


Задание

  1. Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде:
    1. название и ответы на пять вопросов (написать, от лица эксперта или аналитика),
    2. схема в формате IDEF0.
  2. Детализация проекта такова, что план понятен непосвященному читателю.

Материалы

Анкета

Личные инструменты