Автоматизация научных исследований в машинном обучении (практика, В.В. Стрижов)/ФУПМ, осень 2019

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Занятие 3 (20-25 сентября))
(9 промежуточных версий не показаны.)
Строка 41: Строка 41:
== Занятие 2 (13-18 сентября) ==
== Занятие 2 (13-18 сентября) ==
{{tip| Тут будут '''в пятницу в 18:35''' ссылки на
{{tip| Тут будут '''в пятницу в 18:35''' ссылки на
-
* '''видео-стрим''' семинара
+
* [https://youtu.be/c7oTaoDgh4Y '''видео-стрим''' семинара]
-
* hangouts для желающих задать вопрос устно
+
* [https://t.me/Qs_ML ссылка на телеграм для вопросов]}}
-
* если видео будет значимо отставать, то будет ссылка на телеграм для вопросов}}
+
'''Задание'''
'''Задание'''
-
# Загрузить выборку (прежнюю, из UCI, или на ваш вкус), нормировать признаки.
+
# Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки.
-
# Для линейной модели (на выбор регрессии или классификации)
+
# Для линейной модели (на выбор: модель регрессии или классификации)
-
## написать генетический алгоритм выбора признаков (или по вашему выбору)
+
#* написать генетический алгоритм выбора признаков (или другой, по вашему выбору).
-
## построить графики зависимости
+
# Построить графики зависимости,
-
## x-axis is iteration
+
## ось абсцисс: итерации, <!-- x-axis is iteration -->
-
## y-axis is the error function S, train test, std
+
## ось ординат: функция ошибки ''S'' и ее стандартное отклонение (обучающая и тестовая выборка), <!-- y-axis is the error function S, train test, std-->
-
## y-axis is “noodle” of the parameters, std
+
## ось ординат: параметны модели "лапша" (желательно стандартное отклонение), <!-- y-axis is “noodle” of the parameters, std -->
-
## y-axis is the structure indicator function
+
## дополнительно, ось ординат: структура модели, индикаторная вектор-функция. <!-- y-axis is the structure indicator function -->
# Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.
# Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.
 +
'''Материалы'''
 +
* [[Media:Strijov2019FeatureSelection.pdf|Выбор признаков]]
 +
* [[Media:Strijov20192NNUniversalModel.pdf|Структура нейросети]]
 +
'''Анкета'''
 +
* [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)
 +
 +
 +
== Занятие 3 (20-25 сентября) ==
 +
{{tip| Ссылки:
 +
* [видео-стрим семинара]
 +
* [https://t.me/Qs_ML телеграм для вопросов]}}
 +
 +
'''Задание'''
 +
# Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде:
 +
## название и ответы на пять вопросов (написать, от лица эксперта или аналитика),
 +
## схема в формате IDEF0.
 +
# Детализация проекта такова, что план понятен непосвященному читателю.
 +
'''Материалы'''
'''Материалы'''
-
* [[Media:Strijov2019PS-Intro.pdf|Выбор признаков]]
+
* [[Media:Strijov2019IDEF0.pdf|Стандарт IDEF при планировании проектов]]
-
* [[Media:Strijov2019PS-Intro.pdf|Структура нейросети]]
+
* [[Media:Strijov2019Autoencoder.pdf|Автоэнкодер и нейросеть]]
'''Анкета'''
'''Анкета'''
-
* Ожидается
+
<!--- * [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
 +
* [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)
 +
-->

Версия 20:25, 17 сентября 2019


Дополнительные материалы находятся на основной странице
  • Короткий адрес этой страницы bit.ly/PS-ML


Занятие 1 (6-11 сентября)

  1. Подготовка инструментов: выполнить (или проверить, что владеете инструментом),
    • пункты 1, 2, 4, 6, 7, 9, 11, 12 ,13 ДЗ-1 из основной страницы,
    • пункты 4, 5 ДЗ-2.
  2. Получить доступ к https://github.com/Intelligent-Systems-Phystech/
  3. В папке 2019-StartCode создать папку ДЗ Surname2019Linear и файл main.ipynb
    1. В тетради кратко указать название и цель эксперимента.
    2. Загрузить выборку
      1. простую (цена на хлеб),
      2. посложнее (потребление электроэнергии),
      3. совет: лучше загружать по ссылке, а не сохранять в репозиторий.
    3. Построить несколько моделей (пример).
    4. Нарисовать график прогноза (оформление: пример 1, пример 2).
    5. Нарисовать дисперсию прогноза (пример полосы). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
    6. Дополнительно*: предложить способ порождения новых (признаков) моделей.

Материалы

Советы по пользованию репозиторием

  • GitHub: клонируйте мастер и заливайте правки в него, если работаете только со своим кодом. См. краткое руководство по работе с GitHub.
    1. Update first, Commit after (Pull first, Push after)
    2. Your own work only, no external publications
    3. No big files (put link to external datasets)
    4. No temporary nor dummy files

Прочитать, чем отличается branch от fork

Анкета


Занятие 2 (13-18 сентября)

Тут будут в пятницу в 18:35 ссылки на


Задание

  1. Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки.
  2. Для линейной модели (на выбор: модель регрессии или классификации)
    • написать генетический алгоритм выбора признаков (или другой, по вашему выбору).
  3. Построить графики зависимости,
    1. ось абсцисс: итерации,
    2. ось ординат: функция ошибки S и ее стандартное отклонение (обучающая и тестовая выборка),
    3. ось ординат: параметны модели "лапша" (желательно стандартное отклонение),
    4. дополнительно, ось ординат: структура модели, индикаторная вектор-функция.
  4. Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.

Материалы

Анкета

  • Анкета с вопросами (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
  • Анкета "сдача задания" (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
  • Анкета "рецензия" (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)


Занятие 3 (20-25 сентября)

Ссылки:


Задание

  1. Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде:
    1. название и ответы на пять вопросов (написать, от лица эксперта или аналитика),
    2. схема в формате IDEF0.
  2. Детализация проекта такова, что план понятен непосвященному читателю.

Материалы

Анкета

Личные инструменты