Спецкурс «Прикладные задачи анализа данных»

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Лекции)
(Лекции)
Строка 220: Строка 220:
|-
|-
| 07.10.13
| 07.10.13
-
| Разбор первого домашнего задания.'''Искусство визуализации данных'''
+
| Разбор первого домашнего задания. '''Искусство визуализации данных: признаки в задаче [[http://www.kaggle.com/c/bioresponse bioresponse]],
 +
оценка признаков и фолдов, деформация ответов, устойчивость закономерностей, профили лет (в прогнозировании вр.рядов), плотности, оценка качества признаков
 +
с помощью RF и удалений'''
| Слайды и материалы высланы по почте участникам.
| Слайды и материалы высланы по почте участникам.
|-
|-

Версия 16:28, 9 октября 2013

Содержание

Объявление

Спецкурс начал работу 16 сентября (понедельник) в 16:20 (5я пара).

Лектор: Дьяконов Александр



Важно! Для участия в спецкурсе необходимо было зарегистрироваться.

Сейчас регистрация уже закрыта.

Желающие прослушать спецкурс могут дождаться следующего года.


Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Мероприятие проходит в двух режимах:

  • спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
  • спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.

Важно: от участников потребуется выполнение нетривиальных практических заданий!

Слушатели

Рассылки материалов делаются только зарегистрированным пользователям, которые перечислены в таблице (см. ниже).

Слушатели, которые перестают делать домашние задания, удаляются из таблицы. За каждое задание можно получить от 0 до 10 штрафных баллов. 10 штрафных баллов понижают итоговую оценку на один балл.

Условные обозначения:

LB - есть в таблице конкурса (при конкурсном задании), LB-k - занято высокое k-е место (среди слушателей спецкурса), +r - сдан отчёт, {-n} - n штрафных баллов.


ФИО рег задание 1 задание 2 задание 3
Файзи Вахиб маг LB+r
Рыжков Александр Михайлович 417 LB+r
Харациди Олег 417 LB+r
Шаповалов Никита Анатольевич 201 LB+r
Адимов Арсений Владимирович 205 LB+r
Рысьмятова Анастасия Александровна 214 LB+r
Тавыриков Юрий Евгеньевич 205 LB-2+r
Трофимов Михаил Игоревич МФТИ4 LB+r
Шадриков Андрей 417 LB+r
Кульпинов Владимир Константинович 202 LB
Бырдин Александр Владимирович МФТИ4 LB-3
Кудрявцев Георгий Алексеевич 206 LB-1+r
Софиюк Константин Сергеевич 206 LB+r
Долганов Станислав Викторович 206 LB+r
Тихонов Глеб Николаевич 513 LB
Купляков Денис 203 LB
Зак Евгений 517 LB
Шабашев Фёдор Маркович 417 LB
Ломов Никита 417 LB+r
Алёшин Илья 417 LB+r
Славнов Константин Анатольевич 317 LB
Шевцова (Подлевских) Алена ВМКвып LB+r
Гавриков Михаил Игоревич 517 +r {-6}
Ромов Петр Алексеевич 517 {-10}
Фонарев Александр Юрьевич 517 +r {-3}
Дорофеев Николай Юрьевич Яндекс {-10}
Игнатов Алексей Николаевич 416 +r {-3}

Лекции

Число Лекция Материалы, замечания
16.09.13 Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. Домашнее задание: решить задачу (отчёт). Материалы см. в [ветке форума] соревнования.
07.10.13 Разбор первого домашнего задания. Искусство визуализации данных: признаки в задаче [bioresponse],

оценка признаков и фолдов, деформация ответов, устойчивость закономерностей, профили лет (в прогнозировании вр.рядов), плотности, оценка качества признаков с помощью RF и удалений

Слайды и материалы высланы по почте участникам.
14.10.13 Как начать решать второе домашнее задание.

Аннотация

2do

Автор программы: Дьяконов Александр Геннадьевич

Отчётность

  • отчёты по решению конкурсных задач (доклады с презентацией + исходники)
  • зачёт с оценкой в конце семестра

Ссылки

Вводная лекция, которая написана для просеминара.

Глава 12 «Шаманство в анализе данных».

Переработка предыдущего источника в научно-популярную лекцию.

Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.

Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.

Приведены ссылки на сайты с данными реальных задач анализа данных.

Ещё ссылки

Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.