Спецкурс «Прикладные задачи анализа данных»

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Объявление

Спецкурс начал работу 16 сентября (понедельник) в 16:20 (5я пара).

Лектор: Дьяконов Александр



Важно! Для участия в спецкурсе необходимо было зарегистрироваться.

Сейчас регистрация уже закрыта.

Желающие прослушать спецкурс могут дождаться следующего года.


Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Мероприятие проходит в двух режимах:

  • спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
  • спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.

Важно: от участников потребуется выполнение нетривиальных практических заданий!

Слушатели

Рассылки материалов делаются только зарегистрированным пользователям, которые перечислены в таблице (см. ниже).

Слушатели, которые перестают делать домашние задания, удаляются из таблицы. За каждое задание можно получить от 0 до 10 штрафных баллов. 10 штрафных баллов понижают итоговую оценку на один балл.

Условные обозначения:

LB - есть в таблице конкурса (при конкурсном задании), LB-k - занято высокое k-е место (среди слушателей спецкурса), +r - сдан отчёт.


ФИО рег задание 1 задание 2 задание 3
Файзи Вахиб маг LB
Рыжков Александр Михайлович 417 LB
Oleg Kharatsidi 417 LB
Шаповалов Никита Анатольевич 201 LB
Адимов Арсений Владимирович 205 LB
Рысьмятова Анастасия Александровна 214 LB
Тавыриков Юрий Евгеньевич 205 LB-2
Трофимов Михаил Игоревич МФТИ4 LB
Шадриков Андрей 417 LB
Кульпинов Владимир Константинович 202 LB
Бырдин Александр Владимирович МФТИ4 LB-3
Кудрявцев Георгий Алексеевич 206 LB-1
Софиюк Константин Сергеевич 206 LB
Долганов Станислав Викторович 206 LB
Тихонов Глеб Николаевич 513 LB
Купляков Денис 203 LB
Зак Евгений 507 LB
Шабашев Фёдор Маркович 417 LB
Ломов Никита 417 LB
Алёшин Илья 417 LB
Славнов Константин Анатольевич 317 LB
Гавриков Михаил Игоревич 517 ---
Чепарухин Сергей Игоревич 214 ---
Ромов Петр Алексеевич 517 ---
Фонарев Александр Юрьевич 517 ---
Дорофеев Николай Юрьевич Яндекс ---
Федорова Дарья Дмитриевна ВМК2 ---
Чабаненко Владислав Дмитриевич 204 ---
Игнатов Алексей Николаевич 416 ---
Каледин Станислав Витальевич МФТИ4 ---
Шевцова Алена ВМКвып ---

Лекции

Число Лекция Материалы, замечания
16.09.13 Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. Домашнее задание: решить задачу (отчёт). Материалы см. в [ветке форума] соревнования.
07.10.13 Разбор первого домашнего задания.

Аннотация

2do

Автор программы: Дьяконов Александр Геннадьевич

Отчётность

  • отчёты по решению конкурсных задач (доклады с презентацией + исходники)
  • зачёт с оценкой в конце семестра

Ссылки

Вводная лекция, которая написана для просеминара.

Глава 12 «Шаманство в анализе данных».

Переработка предыдущего источника в научно-популярную лекцию.

Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.

Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.

Приведены ссылки на сайты с данными реальных задач анализа данных.

Ещё ссылки

Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.