Практикум на ЭВМ (317)/2011-2012
Материал из MachineLearning.
|
- Обязательный курс для студентов каф. ММП 3 курса, 5-6 семестр.
- Зачёт с оценкой
- Семинарист: А. Г. Дьяконов
- Учебное пособие: Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (практикум на ЭВМ кафедры математических методов прогнозирования).
Последние новости
Для тех, кто не сдал задачу 5 мая
добавлены файлы с заданием (теперь они доступны для скачивания)! |
Задания 2012 года (весна)
- Модельные задачи. Постановка задачи и перечень модельных задач
- Работа с пакетом R
- Базовые команды системы R пособие находится в стадии постоянной правки
- Задание: сделать обзор одного из пакетов системы R. Здесь находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории Machine Learning. Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.
- Работа с пакетами Weka и RapidMiner
- Необходимо до 16:20 19 марта 2012 года предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах doc, rtf, pdf, ps.
- Файлы для тестов в классе
- Решение реальной задачи «Topical Classification of Biomedical Research Papers»
- «Постановка задачи»
- ВАЖНО При регистрации на [1] в названии команды должна присутствовать Ваша фамилия!
- Работа по заданию происходит на вкладке обсуждение.
- По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
- Отчёт (см. требования к отчёту) должен быть выложен на вкладку обсуждение до 16:05 9 апреля 2012 года.
Задания 2011 года (осень)
- «Решение реальной задачи»
- «Данные» (2.5Мб-zip-архив) Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.
- К четвергу 15.12.11 надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
- Также студенты к четвергу 15.12.11 представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
- «Восстановление плотности» (вторая сдача - 24 ноября 2011)
- «Игра» (первая сдача - 6 октября 2011, окончательная сдача - 20 октября 2011)
- «Постановка задачи»
- Первая игра (описание)
- Вторая игра (описание)
- Третья игра (описание)
- Новинка! Игроки (zip-архив) (возможно, не все они корректно играют. К сожалению, были подготовлены в спешке.)
Правила сдачи практикума на ЭВМ для студентов 317 группы
- В течение семестра будет несколько заданий.
- На выполнение каждого задания студентам отводится определённый срок (не меньше 2х недель).
- Задания бывают трёх типов: стандартные, соревновательные и зачёты (по пройденным темам).
- Выполнение каждого задания оценивается некоторым кол-вом баллов (стоимость каждого задания заранее объявляется). При проставлении оценки в конце семестра учитывается сумма набранных баллов (например, ОТЛИЧНО ~ 25 баллов и выше, ХОРОШО ~ от 20 до 24 баллов, УДОВЛЕТВОРИТЕЛЬНО ~ от 15 до 19 баллов).
- Для получения оценки ОТЛИЧНО по практикуму достаточно решения всех стандартных задач и сдачи всех промежуточных зачётов.
- Стандартные задания, в основном, являются заданиями реализации алгоритмов, которые изучаются студентами в курсе ММРО и ПА (в весеннем семестре они все являются таковыми).
- Стандартные задания оцениваются фиксированным кол-ом баллов.
- Сдача этих заданий возможна до определённой даты (позже задания не принимаются).
- Соревновательные задания сдаются в один день! За выполнение такого задания студенты получают символическое кол-во баллов (1-2, часто само выполнение является стандартным заданием). Однако все работы студентов упорядочиваются (критерий упорядочивания заранее оговорен) и лучшие три работы получают "вознаграждения" (например, I место - 5 баллов [с учётом цены задания], II место - 4 балла, III место - 3 балла).
- Все задания принимаются только в машзале и только в часы занятий (см. расписание). Соревновательные задания принимаются только на компьютерах машзала (не на ноутбуках). В крайнем случае, задания могут приниматься на кафедре, но только в часы занятий.
- Задание принимается «за один заход». Преподаватель подходит к студенту, сидящему за компьютером, и принимает задание. Если «что-то не работает», то задание не засчитывается. Преподаватель не ждёт, пока студент исправит задание (исправит настройки, внесёт изменения в листинг и перекомпилирует)! В отдельных случаях разрешается доработать задание тут же в компьютерном классе.
- Если в задание входит написание отчёта, то программа без отчёта не принимается. Отчёт можно сдавать в электронной форме (файл *.doc), если не оговорено противное.
- При сдаче необходим исходный код программы, запускающийся файл (*.exe), отчёт (если требуется).
Требования к отчёту
Обязательные разделы и комментарии:
- Титульный лист
Факультет, кафедра, Ф.И.О. студента, название задания, год выполнения.
- Постановка задачи
Поощряется текстуальное (но не формальное) отличие от официальной постановки.
- Алгоритм решения
Точное чёткое описание.
- Прагматика (не обязательно оформлять в виде отдельного раздела)
ПОЧЕМУ и ЗАЧЕМ выбран именно этот метод решения? Какие есть ещё алгоритмы? Сравнение.
- Примеры работы алгоритма
На модельных и «реальных» задачах. Задачи не должны быть слишком тривиальные.
- Руководство пользователя
Интерфейс работы с программой.
- Руководство программиста
Особенности реализации. Интерфейс встраивания Вашего алгоритма в другие программы. Возможности такого встраивания.
- Список использованной литературы.
Включая ссылки на Web-ресурсы.
- Заключение (не обязательно оформлять в виде отдельного раздела)
Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».