Спецкурс «Прикладные задачи анализа данных»

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Слушатели)
(Слушатели)
Строка 44: Строка 44:
! задание 2
! задание 2
! задание 3
! задание 3
 +
! штраф(сумма на 26.10)
|-
|-
| Файзи Вахиб
| Файзи Вахиб
Строка 50: Строка 51:
|
|
|
|
 +
| 0
|-
|-
| Рыжков Александр Михайлович
| Рыжков Александр Михайлович
Строка 56: Строка 58:
|
|
|
|
 +
| 0
|-
|-
| Харациди Олег
| Харациди Олег
Строка 62: Строка 65:
| +r
| +r
|
|
 +
| 0
|-
|-
| Шаповалов Никита Анатольевич
| Шаповалов Никита Анатольевич
Строка 68: Строка 72:
|
|
|
|
 +
| 0
|-
|-
| Адимов Арсений Владимирович
| Адимов Арсений Владимирович
Строка 74: Строка 79:
|
|
|
|
 +
| 0
|-
|-
| Рысьмятова Анастасия Александровна
| Рысьмятова Анастасия Александровна
Строка 80: Строка 86:
|
|
|
|
 +
| 0
|-
|-
| Тавыриков Юрий Евгеньевич
| Тавыриков Юрий Евгеньевич
Строка 86: Строка 93:
| +r
| +r
|
|
 +
| 0
|-
|-
| Трофимов Михаил Игоревич
| Трофимов Михаил Игоревич
Строка 92: Строка 100:
|
|
|
|
 +
| 0
|-
|-
| Шадриков Андрей
| Шадриков Андрей
Строка 98: Строка 107:
| +r
| +r
|
|
 +
| 0
|-
|-
| Кульпинов Владимир Константинович
| Кульпинов Владимир Константинович
| 202
| 202
-
| LB
+
| LB {-3}
|
|
|
|
 +
| -3
|-
|-
| Бырдин Александр Владимирович
| Бырдин Александр Владимирович
| МФТИ4
| МФТИ4
-
| LB-3
+
| LB-3 {-3}
|
|
|
|
 +
| -3
|-
|-
| Кудрявцев Георгий Алексеевич
| Кудрявцев Георгий Алексеевич
Строка 116: Строка 128:
|
|
|
|
 +
| 0
|-
|-
| Софиюк Константин Сергеевич
| Софиюк Константин Сергеевич
Строка 122: Строка 135:
|
|
|
|
 +
| 0
|-
|-
| Долганов Станислав Викторович
| Долганов Станислав Викторович
Строка 128: Строка 142:
|
|
|
|
 +
| 0
|-
|-
| Тихонов Глеб Николаевич
| Тихонов Глеб Николаевич
Строка 134: Строка 149:
|
|
|
|
 +
| 0
|-
|-
| Купляков Денис
| Купляков Денис
Строка 140: Строка 156:
| +r
| +r
|
|
 +
| 0
|-
|-
| Зак Евгений
| Зак Евгений
| 517
| 517
-
| LB
+
| LB {-3}
|
|
|
|
 +
| -3
|-
|-
| Шабашев Фёдор Маркович
| Шабашев Фёдор Маркович
Строка 152: Строка 170:
|
|
|
|
 +
| 0
|-
|-
| Ломов Никита
| Ломов Никита
Строка 158: Строка 177:
| +r
| +r
|
|
 +
| 0
|-
|-
| Алёшин Илья
| Алёшин Илья
Строка 164: Строка 184:
|
|
|
|
 +
| 0
|-
|-
| Славнов Константин Анатольевич
| Славнов Константин Анатольевич
Строка 170: Строка 191:
|
|
|
|
 +
| 0
|-
|-
| Шевцова (Подлевских) Алена
| Шевцова (Подлевских) Алена
Строка 176: Строка 198:
|
|
|
|
 +
| 0
|-
|-
| Гавриков Михаил Игоревич
| Гавриков Михаил Игоревич
Строка 182: Строка 205:
| +r
| +r
|
|
 +
| -6
|-
|-
| Ромов Петр Алексеевич
| Ромов Петр Алексеевич
Строка 188: Строка 212:
|
|
|
|
 +
| -10
|-
|-
| Фонарев Александр Юрьевич
| Фонарев Александр Юрьевич
Строка 194: Строка 219:
|
|
|
|
 +
| -3
|-
|-
| Дорофеев Николай Юрьевич
| Дорофеев Николай Юрьевич
Строка 200: Строка 226:
|
|
|
|
 +
| -10
|-
|-
| Игнатов Алексей Николаевич
| Игнатов Алексей Николаевич
Строка 206: Строка 233:
|
|
|
|
 +
| -3
|}
|}

Версия 13:48, 26 октября 2013

Содержание

Объявление

Спецкурс начал работу 16 сентября (понедельник) в 16:20 (5я пара).

Лектор: Дьяконов Александр



Важно! Для участия в спецкурсе необходимо было зарегистрироваться.

Сейчас регистрация уже закрыта.

Желающие прослушать спецкурс могут дождаться следующего года.


Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Мероприятие проходит в двух режимах:

  • спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R) и т.п.
  • спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.

Важно: от участников потребуется выполнение нетривиальных практических заданий!

Слушатели

Рассылки материалов делаются только зарегистрированным пользователям, которые перечислены в таблице (см. ниже).

Слушатели, которые перестают делать домашние задания, удаляются из таблицы. За каждое задание можно получить от 0 до 10 штрафных баллов. 10 штрафных баллов понижают итоговую оценку на один балл.

Условные обозначения:

LB - есть в таблице конкурса (при конкурсном задании), LB-k - занято высокое k-е место (среди слушателей спецкурса), +r - сдан отчёт, {-n} - n штрафных баллов.


ФИО рег задание 1 задание 2 задание 3 штраф(сумма на 26.10)
Файзи Вахиб маг LB+r 0
Рыжков Александр Михайлович 417 LB+r 0
Харациди Олег 417 LB+r +r 0
Шаповалов Никита Анатольевич 201 LB+r 0
Адимов Арсений Владимирович 205 LB+r 0
Рысьмятова Анастасия Александровна 214 LB+r 0
Тавыриков Юрий Евгеньевич 205 LB-2+r +r 0
Трофимов Михаил Игоревич МФТИ4 LB+r 0
Шадриков Андрей 417 LB+r +r 0
Кульпинов Владимир Константинович 202 LB {-3} -3
Бырдин Александр Владимирович МФТИ4 LB-3 {-3} -3
Кудрявцев Георгий Алексеевич 206 LB-1+r 0
Софиюк Константин Сергеевич 206 LB+r 0
Долганов Станислав Викторович 206 LB+r 0
Тихонов Глеб Николаевич 513 LB+r 0
Купляков Денис 203 LB+r +r 0
Зак Евгений 517 LB {-3} -3
Шабашев Фёдор Маркович 417 LB+r 0
Ломов Никита 417 LB+r +r 0
Алёшин Илья 417 LB+r 0
Славнов Константин Анатольевич 317 LB+r 0
Шевцова (Подлевских) Алена ВМКвып LB+r 0
Гавриков Михаил Игоревич 517 +r {-6} +r -6
Ромов Петр Алексеевич 517 {-10} -10
Фонарев Александр Юрьевич 517 +r {-3} -3
Дорофеев Николай Юрьевич Яндекс {-10} -10
Игнатов Алексей Николаевич 416 +r {-3} -3

Лекции

Число Лекция Материалы, замечания
16.09.13 Решение задачи [The Big Data Combine Engineered by BattleFin] - прогноз цены на основе многомерного ряда и анонимизированных признаков. Загрузка данных, простые модели, линейная регрессия и случайный лес, сравнение R и MATLAB. Домашнее задание: решить задачу (отчёт). Материалы см. в [ветке форума] соревнования.
07.10.13 Разбор первого домашнего задания. Искусство визуализации данных: признаки в задаче [bioresponse], оценка признаков и фолдов, деформация ответов, устойчивость закономерностей, профили лет (в прогнозировании вр.рядов), плотности, оценка качества признаков с помощью RF и удалений Слайды и материалы высланы по почте участникам.
14.10.13 Продолжение Искусство визуализации данных: Результаты алгоритмов и их линейные комбинации, ручная деформация пространств, визуализация и сглаживание плотностей, построение профилей. Что надо знать о признаках. Визуализация по-вертикали и по-горизонтали. Шумы и шумовые признаки. Задачи [cause-effect-pairs], [GiveMeSomeCredit], [DarkWorlds]. Как начать решать второе домашнее задание. Слайды и материалы высланы по почте участникам.
21.10.13 Вторая задача: мозговой штурм. Оценка среднего, оценка вероятности, оценка плотности. Весовые схемы. Задача [dunnhumby].
28.10.13 Продолжение Оценка плотности. Весовые схемы.

Аннотация

2do

Автор программы: Дьяконов Александр Геннадьевич

Отчётность

  • отчёты по решению конкурсных задач (доклады с презентацией + исходники)
  • зачёт с оценкой в конце семестра

Ссылки

Вводная лекция, которая написана для просеминара.

Глава 12 «Шаманство в анализе данных».

Переработка предыдущего источника в научно-популярную лекцию.

Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.

Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.

Приведены ссылки на сайты с данными реальных задач анализа данных.

Ещё ссылки

Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.