Спецкурс «Прикладные задачи анализа данных»

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Объявление

В ближайшее время, предположительно 16 сентября (понедельник) в 16:20 (5я пара), начнёт работу спецкурс-семинар «Прикладные задачи анализа данных»

Лектор: Дьяконов Александр



Важно! Для участия в спецкурсе надо предварительно зарегистрироваться.

Для этого отправьте письмо лектору (djakonov -собака- mail -точка- ru).

Тема письма ПЗАД + Ваши ФИО. Далее кратко опишите, почему хотите посещать спецкурс, Ваш бэкграунд, готовы ли Вы тратить своё свободное время на решение задач из турниров по анализу данных.


Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Мероприятие проходит в двух режимах:

  • спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
  • спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.

Важно: от участников потребуется выполнение нетривиальных практических заданий!

Детали появятся в ближайшее время на странице кафедры (ну и на этой странице). Дни недели сейчас определяются (рассматриваемые варианты: 4,5,6 пары понедельника, вторника и среды). Можно повлиять на дату мероприятия, написав письмо лектору на почту djakonov(собака)mail(точка)ru

Лекции

Число Лекция Материалы, замечания
(?)16.07.13 Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. Домашнее задание: решить задачу (отчёт)
 ??.08.13

Аннотация

2do

Автор программы: Дьяконов Александр Геннадьевич

Отчётность

  • отчёты по решению конкурсных задач (доклады с презентацией + исходники)
  • зачёт с оценкой в конце семестра

Ссылки

Вводная лекция, которая написана для просеминара.

Глава 12 «Шаманство в анализе данных».

Переработка предыдущего источника в научно-популярную лекцию.

Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.

Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.

Приведены ссылки на сайты с данными реальных задач анализа данных.

Ещё ссылки

Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.