Автоматизация научных исследований в машинном обучении (практика, В.В. Стрижов)/ФУПМ, осень 2019
Материал из MachineLearning.
(Различия между версиями)
(→Занятие 1) |
(→Занятие 3 (20-25 сентября)) |
||
(37 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | {{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | ||
- | {{tip| | + | {{tip|Дополнительные материалы находятся [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|на основной странице]]''' |
* Короткий адрес этой страницы [http://bit.ly/PS-ML bit.ly/PS-ML] | * Короткий адрес этой страницы [http://bit.ly/PS-ML bit.ly/PS-ML] | ||
}} | }} | ||
== Занятие 1 (6-11 сентября) == | == Занятие 1 (6-11 сентября) == | ||
+ | # Подготовка инструментов: выполнить (или проверить, что владеете инструментом), | ||
+ | #* пункты '''1, 2, 4, 6, 7, 9, 11, 12 ,13''' ДЗ-1 из основной страницы, | ||
+ | #* пункты '''4, 5''' ДЗ-2. | ||
+ | # Получить доступ к [https://github.com/Intelligent-Systems-Phystech/ https://github.com/Intelligent-Systems-Phystech/] | ||
+ | # В папке [https://github.com/Intelligent-Systems-Phystech/2019-StartCode 2019-StartCode] создать папку ДЗ '''Surname2019Linear''' и файл '''main.ipynb''' | ||
+ | ## В тетради кратко указать название и цель эксперимента. | ||
+ | ## Загрузить выборку | ||
+ | ### [https://sourceforge.net/p/mvr/code/HEAD/tree/data/WhiteBreadPrices.csv?format=raw простую] (цена на хлеб), | ||
+ | ### [https://sourceforge.net/p/mvr/code/HEAD/tree/data/EnergyConsumption.xls?format=raw посложнее] (потребление электроэнергии), | ||
+ | ### совет: лучше загружать по ссылке, а не сохранять в репозиторий. | ||
+ | ## Построить несколько моделей ([[Линейная регрессия (пример)|пример]]). | ||
+ | ## Нарисовать график прогноза (оформление: [[JMLDA/Fig|пример 1]], [https://colab.research.google.com/drive/1Mv4CCAn7iRqs1BUR9zlQlu2lFqqpndST пример 2]). | ||
+ | ## Нарисовать дисперсию прогноза ([https://nbviewer.jupyter.org/github/Intelligent-Systems-Phystech/StartCode/blob/master/Kachkov2018LateProblem2/LateProblem2.ipynb пример полосы]). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз. | ||
+ | ## Дополнительно*: предложить способ порождения новых (признаков) моделей. | ||
+ | |||
+ | '''Материалы''' | ||
+ | * [[Media:Strijov2019PS-Intro.pdf|Вводные слайды]] | ||
+ | '''Советы по пользованию репозиторием''' | ||
+ | * GitHub: клонируйте '''мастер''' и заливайте правки в него, если работаете только со своим кодом. [https://github.com/Strijov/Strijov2018-1AutomationOfResearch/raw/master/GitHubSimplest.pdf См. краткое руководство по работе с GitHub]. | ||
+ | *# '''Update first''', Commit after (Pull first, Push after) | ||
+ | *# '''Your own work only''', no external publications | ||
+ | *# '''No big files''' (put link to external datasets) | ||
+ | *# '''No temporary''' nor dummy files | ||
+ | Прочитать, чем '''[https://stackoverflow.com/questions/5009600/difference-between-fork-and-branch-on-github отличается branch от fork]''' | ||
+ | '''Анкета''' | ||
+ | * [https://forms.gle/RCRs2RBJxP8Rv5vD6 Анкета "'''записаться на курс'''"] (стоит отдельно от основной по просьбе робота. Внимание работает только под @phystech.edu и только один раз) | ||
+ | * [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (стоит отдельно от основной. нужна для того, чтобы собрать название папок GitHub где Вы выполнили задание) | ||
+ | * [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (стоит отдельно от основной. нужна для того, чтобы собрать рецензии людей) | ||
+ | * [https://forms.gle/YyCBiD852y59QVdC7 Анкета с вопросами на повторение] (основная) | ||
+ | |||
+ | |||
+ | == Занятие 2 (13-18 сентября) == | ||
+ | {{tip| Тут будут '''в пятницу в 18:35''' ссылки на | ||
+ | * [https://youtu.be/c7oTaoDgh4Y '''видео-стрим''' семинара] | ||
+ | * [https://t.me/Qs_ML ссылка на телеграм для вопросов]}} | ||
+ | |||
+ | '''Задание''' | ||
+ | # Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки. | ||
+ | # Для линейной модели (на выбор: модель регрессии или классификации) | ||
+ | #* написать генетический алгоритм выбора признаков (или другой, по вашему выбору). | ||
+ | # Построить графики зависимости, | ||
+ | ## ось абсцисс: итерации, <!-- x-axis is iteration --> | ||
+ | ## ось ординат: функция ошибки ''S'' и ее стандартное отклонение (обучающая и тестовая выборка), <!-- y-axis is the error function S, train test, std--> | ||
+ | ## ось ординат: параметны модели "лапша" (желательно стандартное отклонение), <!-- y-axis is “noodle” of the parameters, std --> | ||
+ | ## дополнительно, ось ординат: структура модели, индикаторная вектор-функция. <!-- y-axis is the structure indicator function --> | ||
+ | # Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети. | ||
'''Материалы''' | '''Материалы''' | ||
+ | * [[Media:Strijov2019FeatureSelection.pdf|Выбор признаков]] | ||
+ | * [[Media:Strijov20192NNUniversalModel.pdf|Структура нейросети]] | ||
+ | |||
+ | '''Анкета''' | ||
+ | * [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | * [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | * [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | |||
+ | |||
+ | == Занятие 3 (20-25 сентября) == | ||
+ | {{tip| Ссылки: | ||
+ | * [видео-стрим семинара] | ||
+ | * [https://t.me/Qs_ML телеграм для вопросов]}} | ||
+ | |||
+ | '''Задание''' | ||
+ | # Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде: | ||
+ | ## название и ответы на пять вопросов (написать, от лица эксперта или аналитика), | ||
+ | ## схема в формате IDEF0. | ||
+ | # Детализация проекта такова, что план понятен непосвященному читателю. | ||
+ | |||
+ | '''Материалы''' | ||
+ | * [[Media:Strijov2019IDEF0.pdf|Стандарт IDEF при планировании проектов]] | ||
+ | * [[Media:Strijov2019Autoencoder.pdf|Автоэнкодер и нейросеть]] | ||
+ | |||
+ | '''Анкета''' | ||
+ | <!--- * [https://forms.gle/LdnZSmjJWVTzZTAYA Анкета с вопросами] (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | * [https://forms.gle/EFjLLr27jJdBAheB9 Анкета '''"сдача задания'''"] (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | * [https://forms.gle/bAjdzDthU1QcGEpt8 Анкета '''"рецензия'''"] (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu) | ||
+ | --> |
Версия 20:25, 17 сентября 2019
Дополнительные материалы находятся на основной странице
|
Занятие 1 (6-11 сентября)
- Подготовка инструментов: выполнить (или проверить, что владеете инструментом),
- пункты 1, 2, 4, 6, 7, 9, 11, 12 ,13 ДЗ-1 из основной страницы,
- пункты 4, 5 ДЗ-2.
- Получить доступ к https://github.com/Intelligent-Systems-Phystech/
- В папке 2019-StartCode создать папку ДЗ Surname2019Linear и файл main.ipynb
- В тетради кратко указать название и цель эксперимента.
- Загрузить выборку
- Построить несколько моделей (пример).
- Нарисовать график прогноза (оформление: пример 1, пример 2).
- Нарисовать дисперсию прогноза (пример полосы). Дисперсия в каждом значении зависимой переменной вычисляется путем случайного семплирования обучающей выборки, выборка разбивается несколько раз.
- Дополнительно*: предложить способ порождения новых (признаков) моделей.
Материалы
Советы по пользованию репозиторием
- GitHub: клонируйте мастер и заливайте правки в него, если работаете только со своим кодом. См. краткое руководство по работе с GitHub.
- Update first, Commit after (Pull first, Push after)
- Your own work only, no external publications
- No big files (put link to external datasets)
- No temporary nor dummy files
Прочитать, чем отличается branch от fork
Анкета
- Анкета "записаться на курс" (стоит отдельно от основной по просьбе робота. Внимание работает только под @phystech.edu и только один раз)
- Анкета "сдача задания" (стоит отдельно от основной. нужна для того, чтобы собрать название папок GitHub где Вы выполнили задание)
- Анкета "рецензия" (стоит отдельно от основной. нужна для того, чтобы собрать рецензии людей)
- Анкета с вопросами на повторение (основная)
Занятие 2 (13-18 сентября)
Тут будут в пятницу в 18:35 ссылки на |
Задание
- Загрузить выборку (из прежнего задания, или из UCI, или на ваш вкус), нормировать признаки.
- Для линейной модели (на выбор: модель регрессии или классификации)
- написать генетический алгоритм выбора признаков (или другой, по вашему выбору).
- Построить графики зависимости,
- ось абсцисс: итерации,
- ось ординат: функция ошибки S и ее стандартное отклонение (обучающая и тестовая выборка),
- ось ординат: параметны модели "лапша" (желательно стандартное отклонение),
- дополнительно, ось ординат: структура модели, индикаторная вектор-функция.
- Дополнительно: применить генетический алгоритм к выбору двухслойной нейросети и нарисовать те же графики и кривую обучения нейросети.
Материалы
Анкета
- Анкета с вопросами (основная. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
- Анкета "сдача задания" (для указание папки на GitHub со 2м заданием. дедлайн 19.09.2019 9:00. доступна только с почты @phystech.edu)
- Анкета "рецензия" (собрать результаты людей. дедлайн 20.09.2019 9:00. доступна только с почты @phystech.edu)
Занятие 3 (20-25 сентября)
Ссылки:
|
Задание
- Выбрать проект на свой вкус, и записать его план (pdf) в следующем виде:
- название и ответы на пять вопросов (написать, от лица эксперта или аналитика),
- схема в формате IDEF0.
- Детализация проекта такова, что план понятен непосвященному читателю.
Материалы
Анкета