Практикум на ЭВМ (317)/2011-2012

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Последние новости)
Текущая версия (06:55, 5 сентября 2017) (править) (отменить)
 
(48 промежуточных версий не показаны.)
Строка 7: Строка 7:
= Последние новости =
= Последние новости =
 +
{{tip|
{{tip|
-
'''ВНИМАНИЕ!''' Ситуацию с машзалом я выяснил (старосте ничего делать не надо). 6 октября попробуем туда проникнуть (без меня, к сожалению, вам туда не попасть). --[[Участник:Dj|Дь-ов]] 18:18, 15 сентября 2011 (MSD)
+
Для тех, кто не сдал задачу '''5 мая'''
 +
добавлены файлы с заданием (теперь они доступны для скачивания)!
}}
}}
-
* Выложены «Игроки» для игр.
+
 
-
* Выложено первое задание «Игра»
+
 
-
* Выложена ссылка на [[Публикация:Дьяконов 2010 Учебное пособие ММП| учебное пособие]].
+
{{tip|
 +
Сдача задания по модельной задаче (презентация исследований) состоится '''5 мая'''.
 +
Необходимо до этого числа (!) прислать файл ''' [''Имя файла с задачей'']z.mat ''' (пример имени файла: mat317n21trainz.mat),
 +
в котором содержатся 2 переменные: '''ANS''' (вектор-столбец с ответами для всех объектов),
 +
'''FEAT''' (логическая вектор-строка с пометками существенных признаков).
 +
Если задача решена не в Матлабе и ответ не может быть переконвертирован в нужный формат,
 +
присылаются два txt-файла ''' [''Имя файла с задачей'']ANS.txt ''', ''' [''Имя файла с задачей'']FEAT.txt '''.
 +
 
 +
}}
 +
 
 +
= Задания 2012 года (весна) =
 +
* Модельные задачи. [[Media:z2012v-2.pdf| '''Постановка задачи и перечень модельных задач''']]
 +
* Работа с пакетом [http://cran.gis-lab.info/ R]
 +
** [http://alexanderdyakonov.narod.ru/upR.pdf Базовые команды системы R] '''пособие находится в стадии постоянной правки'''
 +
** Задание: сделать обзор одного из пакетов системы [http://cran.gis-lab.info/ R]. [http://cran.gis-lab.info/web/views/ Здесь] находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории [http://cran.gis-lab.info/web/views/MachineLearning.html Machine Learning]. '''Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.'''
 +
* Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner]
 +
** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''.
 +
** [[Media:Mtx12.zip| Файлы для тестов в классе]]
 +
* Решение реальной задачи [http://tunedit.org/challenge/JRS12Contest «Topical Classification of Biomedical Research Papers»]
 +
** [[Media:Z2012sp-1.doc| «Постановка задачи»]]
 +
** '''ВАЖНО''' При регистрации на [http://tunedit.org] в названии команды должна присутствовать Ваша фамилия!
 +
** Работа по заданию происходит на вкладке [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение].
 +
** По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
 +
** Отчёт (см. [[Media:z2012v-1.pdf| требования к отчёту]]) должен быть выложен на вкладку [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение] до '''16:05''' 9 апреля 2012 года.
= Задания 2011 года (осень) =
= Задания 2011 года (осень) =
-
* «Игра» (первая сдача - '''6 октября 2011''')
+
* «Решение реальной задачи»
 +
** [[Media:mmpz1.zip| «Данные»]] (2.5Мб-zip-архив) ''Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.''
 +
** К '''четвергу 15.12.11''' надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
 +
** Также студенты к '''четвергу 15.12.11''' представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
 +
* «Восстановление плотности» (вторая сдача - '''24 ноября 2011''')
 +
** [[Media:Z2011au-2.doc| «Постановка задачи»]]
 +
** [[Media:rec2011.doc| «Рекомендации по проведению НИ»]]
 +
* «Игра» (первая сдача - '''6 октября 2011''', окончательная сдача - '''20 октября 2011''')
** [[Media:Z2011o-1.doc| «Постановка задачи»]]
** [[Media:Z2011o-1.doc| «Постановка задачи»]]
** [[Media:Game1-2011.doc| Первая игра (описание)]]
** [[Media:Game1-2011.doc| Первая игра (описание)]]
** [[Media:Game2-2011.doc| Вторая игра (описание)]]
** [[Media:Game2-2011.doc| Вторая игра (описание)]]
** [[Media:Game3-2011.doc| Третья игра (описание)]]
** [[Media:Game3-2011.doc| Третья игра (описание)]]
 +
** '''Новинка!''' [[Media:Gamers.zip‎| Игроки (zip-архив)]] (возможно, не все они корректно играют. К сожалению, были подготовлены в спешке.)
= Правила сдачи практикума на ЭВМ для студентов 317 группы =
= Правила сдачи практикума на ЭВМ для студентов 317 группы =
Строка 58: Строка 91:
* Заключение (не обязательно оформлять в виде отдельного раздела)
* Заключение (не обязательно оформлять в виде отдельного раздела)
''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».''
''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».''
 +
 +
[[Категория:Кафедра Математические методы прогнозирования ВМиК МГУ]]
 +
[[Категория:Учебные практикумы]]

Текущая версия

Содержание

Последние новости

Для тех, кто не сдал задачу 5 мая

добавлены файлы с заданием (теперь они доступны для скачивания)!



Сдача задания по модельной задаче (презентация исследований) состоится 5 мая.

Необходимо до этого числа (!) прислать файл [Имя файла с задачей]z.mat (пример имени файла: mat317n21trainz.mat), в котором содержатся 2 переменные: ANS (вектор-столбец с ответами для всех объектов), FEAT (логическая вектор-строка с пометками существенных признаков). Если задача решена не в Матлабе и ответ не может быть переконвертирован в нужный формат, присылаются два txt-файла [Имя файла с задачей]ANS.txt , [Имя файла с задачей]FEAT.txt .


Задания 2012 года (весна)

  • Модельные задачи. Постановка задачи и перечень модельных задач
  • Работа с пакетом R
    • Базовые команды системы R пособие находится в стадии постоянной правки
    • Задание: сделать обзор одного из пакетов системы R. Здесь находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории Machine Learning. Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.
  • Работа с пакетами Weka и RapidMiner
    • Необходимо до 16:20 19 марта 2012 года предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах doc, rtf, pdf, ps.
    • Файлы для тестов в классе
  • Решение реальной задачи «Topical Classification of Biomedical Research Papers»
    • «Постановка задачи»
    • ВАЖНО При регистрации на [1] в названии команды должна присутствовать Ваша фамилия!
    • Работа по заданию происходит на вкладке обсуждение.
    • По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
    • Отчёт (см. требования к отчёту) должен быть выложен на вкладку обсуждение до 16:05 9 апреля 2012 года.

Задания 2011 года (осень)

  • «Решение реальной задачи»
    • «Данные» (2.5Мб-zip-архив) Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.
    • К четвергу 15.12.11 надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
    • Также студенты к четвергу 15.12.11 представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
  • «Восстановление плотности» (вторая сдача - 24 ноября 2011)
  • «Игра» (первая сдача - 6 октября 2011, окончательная сдача - 20 октября 2011)

Правила сдачи практикума на ЭВМ для студентов 317 группы

  • В течение семестра будет несколько заданий.
  • На выполнение каждого задания студентам отводится определённый срок (не меньше 2х недель).
  • Задания бывают трёх типов: стандартные, соревновательные и зачёты (по пройденным темам).
  • Выполнение каждого задания оценивается некоторым кол-вом баллов (стоимость каждого задания заранее объявляется). При проставлении оценки в конце семестра учитывается сумма набранных баллов (например, ОТЛИЧНО ~ 25 баллов и выше, ХОРОШО ~ от 20 до 24 баллов, УДОВЛЕТВОРИТЕЛЬНО ~ от 15 до 19 баллов).
  • Для получения оценки ОТЛИЧНО по практикуму достаточно решения всех стандартных задач и сдачи всех промежуточных зачётов.
  • Стандартные задания, в основном, являются заданиями реализации алгоритмов, которые изучаются студентами в курсе ММРО и ПА (в весеннем семестре они все являются таковыми).
  • Стандартные задания оцениваются фиксированным кол-ом баллов.
  • Сдача этих заданий возможна до определённой даты (позже задания не принимаются).
  • Соревновательные задания сдаются в один день! За выполнение такого задания студенты получают символическое кол-во баллов (1-2, часто само выполнение является стандартным заданием). Однако все работы студентов упорядочиваются (критерий упорядочивания заранее оговорен) и лучшие три работы получают "вознаграждения" (например, I место - 5 баллов [с учётом цены задания], II место - 4 балла, III место - 3 балла).
  • Все задания принимаются только в машзале и только в часы занятий (см. расписание). Соревновательные задания принимаются только на компьютерах машзала (не на ноутбуках). В крайнем случае, задания могут приниматься на кафедре, но только в часы занятий.
  • Задание принимается «за один заход». Преподаватель подходит к студенту, сидящему за компьютером, и принимает задание. Если «что-то не работает», то задание не засчитывается. Преподаватель не ждёт, пока студент исправит задание (исправит настройки, внесёт изменения в листинг и перекомпилирует)! В отдельных случаях разрешается доработать задание тут же в компьютерном классе.
  • Если в задание входит написание отчёта, то программа без отчёта не принимается. Отчёт можно сдавать в электронной форме (файл *.doc), если не оговорено противное.
  • При сдаче необходим исходный код программы, запускающийся файл (*.exe), отчёт (если требуется).

Требования к отчёту

Обязательные разделы и комментарии:

  • Титульный лист

Факультет, кафедра, Ф.И.О. студента, название задания, год выполнения.

  • Постановка задачи

Поощряется текстуальное (но не формальное) отличие от официальной постановки.

  • Алгоритм решения

Точное чёткое описание.

  • Прагматика (не обязательно оформлять в виде отдельного раздела)

ПОЧЕМУ и ЗАЧЕМ выбран именно этот метод решения? Какие есть ещё алгоритмы? Сравнение.

  • Примеры работы алгоритма

На модельных и «реальных» задачах. Задачи не должны быть слишком тривиальные.

  • Руководство пользователя

Интерфейс работы с программой.

  • Руководство программиста

Особенности реализации. Интерфейс встраивания Вашего алгоритма в другие программы. Возможности такого встраивания.

  • Список использованной литературы.

Включая ссылки на Web-ресурсы.

  • Заключение (не обязательно оформлять в виде отдельного раздела)

Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».

Личные инструменты