Спецкурс «Прикладные задачи анализа данных»

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Объявление)
Строка 85: Строка 85:
| 20.09
| 20.09
|}
|}
-
 
-
'''ДОВОДИМАЯ РАНЕЕ ИНФОРМАЦИЯ:'''
 
-
В сентябре 2014 года будет объявлен новый набор слушателей спецкурса.
 
-
 
-
Поскольку обычно желающих очень много, а работа на спецкурсе подразумевает сильную вовлечённость
 
-
студентов и небольшое число слушателей, то будет произведён отбор.
 
-
 
-
Для участия в отборе необходимо:
 
-
* освоить (если его не было в учебной программе) курс [[Машинное обучение (курс лекций, К.В.Воронцов)|Машинное обучение]],
 
-
* выступить хотя бы в одном соревновании по анализу данных (см. ниже),
 
-
* Пройти анкетирование (или собеседование в сентябре).
 
-
 
-
Список допустимых соревнований:
 
-
* [http://www.kaggle.com/c/criteo-display-ad-challenge Display Advertising Challenge] '''завершён'''
 
-
* [http://www.kaggle.com/c/liberty-mutual-fire-peril Liberty Mutual Group - Fire Peril Loss Cost] '''завершён'''
 
-
* [http://www.kaggle.com/c/avito-prohibited-content The Hunt for Prohibited Content] '''завершён'''
 
-
* [http://www.kaggle.com/c/higgs-boson Higgs Boson Machine Learning Challenge] '''завершён'''
 
-
* [http://www.kaggle.com/c/decoding-the-human-brain ecMeg2014 - Decoding the Human Brain] '''завершён'''
 
-
* [http://www.kaggle.com/c/seizure-detection Detect seizures in intracranial EEG recordings] '''завершён'''
 
-
* [http://www.kaggle.com/c/kdd-cup-2014-predicting-excitement-at-donors-choose KDD Cup 2014 - Predicting Excitement at DonorsChoose.org] '''завершён'''
 
-
* [http://www.kaggle.com/c/acquire-valued-shoppers-challenge Acquire Valued Shoppers Challenge] '''завершён'''
 
-
* [http://www.kaggle.com/c/wise-2014 Greek Media Monitoring Multilabel Classification (WISE 2014)] '''завершён'''
 
-
 
-
Результат будет учитываться при отборе. Участие в соревновании не гарантирует отбор!
 
-
 
-
В новой версии спецкурса будет серия лекций
 
-
по системам Matlab и R.
 
-
 
-
Кроме того, будут рассмотрены новые темы:
 
-
например, анализ соцсетей.
 
== Аннотация ==
== Аннотация ==
Строка 195: Строка 165:
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.
Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.
 +
== ДОВОДИМАЯ РАНЕЕ ИНФОРМАЦИЯ (уже не актуальна) ==
 +
В сентябре 2014 года будет объявлен новый набор слушателей спецкурса.
 +
 +
Поскольку обычно желающих очень много, а работа на спецкурсе подразумевает сильную вовлечённость
 +
студентов и небольшое число слушателей, то будет произведён отбор.
 +
 +
Для участия в отборе необходимо:
 +
* освоить (если его не было в учебной программе) курс [[Машинное обучение (курс лекций, К.В.Воронцов)|Машинное обучение]],
 +
* выступить хотя бы в одном соревновании по анализу данных (см. ниже),
 +
* Пройти анкетирование (или собеседование в сентябре).
 +
 +
Список допустимых соревнований:
 +
* [http://www.kaggle.com/c/criteo-display-ad-challenge Display Advertising Challenge] '''завершён'''
 +
* [http://www.kaggle.com/c/liberty-mutual-fire-peril Liberty Mutual Group - Fire Peril Loss Cost] '''завершён'''
 +
* [http://www.kaggle.com/c/avito-prohibited-content The Hunt for Prohibited Content] '''завершён'''
 +
* [http://www.kaggle.com/c/higgs-boson Higgs Boson Machine Learning Challenge] '''завершён'''
 +
* [http://www.kaggle.com/c/decoding-the-human-brain ecMeg2014 - Decoding the Human Brain] '''завершён'''
 +
* [http://www.kaggle.com/c/seizure-detection Detect seizures in intracranial EEG recordings] '''завершён'''
 +
* [http://www.kaggle.com/c/kdd-cup-2014-predicting-excitement-at-donors-choose KDD Cup 2014 - Predicting Excitement at DonorsChoose.org] '''завершён'''
 +
* [http://www.kaggle.com/c/acquire-valued-shoppers-challenge Acquire Valued Shoppers Challenge] '''завершён'''
 +
* [http://www.kaggle.com/c/wise-2014 Greek Media Monitoring Multilabel Classification (WISE 2014)] '''завершён'''
 +
 +
Результат будет учитываться при отборе. Участие в соревновании не гарантирует отбор!
 +
 +
В новой версии спецкурса будет серия лекций
 +
по системам Matlab и R.
 +
 +
Кроме того, будут рассмотрены новые темы:
 +
например, анализ соцсетей.
 +
 +
 +
'''Объявлен набор слушателей на спецкурс (5 сентября 2014 года).'''
 +
Необходима регистрация! Для этого надо прислать на почту <tt>djakonov (собака) mail (точка) ru</tt>
 +
 +
'''Тема письма:''' [ПЗАД] Фамилия студента
 +
 +
'''Текст:''' в первой строке через точку с запятой указываются
 +
* Фамилия Имя Отчество,
 +
* группа (вуз, если из другого вуза),
 +
* в скольких соревнования на сайте Kaggle участвовали (число),
 +
* какие курсы по машинному обучению прослушаны,
 +
* желаемые дни и часы (в формате ПТН, 18-00),
 +
* знакомые языки и системы программирования, включая программы и библиотеки для машинного обучения,
 +
* страница на Kaggle,
 +
* сколько часов в неделю готовы уделять выполнению практических заданий.
 +
 +
В других строчках (начиная со второй) можно по желанию дать пояснения.
 +
 +
Пример:
 +
<code>Дьяконов Александр Геннадьевич; 617; 25; ММРО Воронцов; ВТ 18-00, СР 16-20; R, Matlab, Python, Weka, RapidMiner, Liblinear, VW; https://www.kaggle.com/users/3090/alexander-d-yakonov; 8</code>
 +
 +
'''Посещение спецкурса закрытое, число мест ограничено, регистрация скоро будет закрыта – спешите…'''
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Версия 20:26, 21 сентября 2014

Содержание

Объявление

Регистрация на спецкурс завершена. Кто не успел - ждите следующего года.


Зарегистрированные слушатели получили 3 инфо-рассылки (в них вся информация по времени и дате спецкурса).



ЗАПИСАЛИСЬ группа регистрация
Семёнов Станислав Георгиевич ВШЭ 05.09
Арбузова Дарья Андреевна 517 05.09
Гущин Александр Евгеньевич МФТИ 05.09
Потапенко Анна Александровна 617 06.09
Фенстер Александра Михайловна НИУ ВШЭ 172мАИД 06.09
Вихрева Мария Викторовна 315 06.09
Бахтин Антон Вячеславович МГУ, Яндекс 06.09
Ульянов Дмитрий Владимирович 517 07.09
Шапулин Андрей Валентинович 417 07.09
Сиверский Михаил Николаевич физфак 09.09
Игнатов Алексей Николаевич 516 11.09
Сокурский Юрий Валентинович 517 12.09
Дойков Никита Владимирович 417 14.09
Лукашкина Юлия Николаевна 417 15.09
Байбурин Валерий Тагирович м118 15.09
Дымов Григорий Андреевич Stockholm university 16.09
Чинаев Николай Николаевич МФТИ 17.09
Хальман Михаил Анатольевич 417 20.09

Аннотация

Данный курс стал победителем конкурса инновационных учебных технологий.



Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т.п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Мероприятие проходит в двух режимах:

  • спецкурса – лекции о решении прикладных задач, обучение некоторым системам анализа данных (например R, Matlab, Python+ и т.п.
  • спецсеминара – обсуждение решаемых задач, выработка общих стратегий, разделение работы в рамках участия в соревновании одной командой, мозговой штурм и т.п.

Важно: от участников потребуется выполнение нетривиальных практических заданий!

Лектор: Дьяконов Александр

Страницы курсов прошлых лет

Спецкурс «Прикладные задачи анализа данных» (2013 год)


Правила

  • Рассылки материалов делаются только зарегистрированным слушателям курса (перечислены в таблице слушателей).
  • Слушатели, которые перестают делать домашние задания, удаляются из таблицы.

Лекции

Здесь будет выложена программа нового (2014 года) - по мере чтения курса.

Лекции

Число Лекция Материалы, замечания
24.09.14 Эффективное программирование в системе Matlab Рекомендованное учебное пособие: Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab
01.10.14 Вводное занятие: цели курса, материалы, правила, участие в соревнованиях.


Старую программу см. на странице Спецкурс «Прикладные задачи анализа данных» (2013 год).

Отчётность

  • отчёты по решению конкурсных задач (доклады с презентацией + исходники)
  • зачёт с оценкой в конце семестра

Ссылки

Вводная лекция, которая написана для просеминара.

Глава 12 «Шаманство в анализе данных».

Переработка предыдущего источника в научно-популярную лекцию.

Рассказываются тонкости решения задач, которые умалчиваются в основных курсах.

Подробное описание некоторых простых алгоритмов для прогнозирования туристических временных рядов.

Приведены ссылки на сайты с данными реальных задач анализа данных.

Ещё ссылки

Неплохая короткая демка про соревнования в анализе данных, платформы для соревнований и возможности системы R.

ДОВОДИМАЯ РАНЕЕ ИНФОРМАЦИЯ (уже не актуальна)

В сентябре 2014 года будет объявлен новый набор слушателей спецкурса.

Поскольку обычно желающих очень много, а работа на спецкурсе подразумевает сильную вовлечённость студентов и небольшое число слушателей, то будет произведён отбор.

Для участия в отборе необходимо:

  • освоить (если его не было в учебной программе) курс Машинное обучение,
  • выступить хотя бы в одном соревновании по анализу данных (см. ниже),
  • Пройти анкетирование (или собеседование в сентябре).

Список допустимых соревнований:

Результат будет учитываться при отборе. Участие в соревновании не гарантирует отбор!

В новой версии спецкурса будет серия лекций по системам Matlab и R.

Кроме того, будут рассмотрены новые темы: например, анализ соцсетей.


Объявлен набор слушателей на спецкурс (5 сентября 2014 года). Необходима регистрация! Для этого надо прислать на почту djakonov (собака) mail (точка) ru

Тема письма: [ПЗАД] Фамилия студента

Текст: в первой строке через точку с запятой указываются

  • Фамилия Имя Отчество,
  • группа (вуз, если из другого вуза),
  • в скольких соревнования на сайте Kaggle участвовали (число),
  • какие курсы по машинному обучению прослушаны,
  • желаемые дни и часы (в формате ПТН, 18-00),
  • знакомые языки и системы программирования, включая программы и библиотеки для машинного обучения,
  • страница на Kaggle,
  • сколько часов в неделю готовы уделять выполнению практических заданий.

В других строчках (начиная со второй) можно по желанию дать пояснения.

Пример: Дьяконов Александр Геннадьевич; 617; 25; ММРО Воронцов; ВТ 18-00, СР 16-20; R, Matlab, Python, Weka, RapidMiner, Liblinear, VW; https://www.kaggle.com/users/3090/alexander-d-yakonov; 8

Посещение спецкурса закрытое, число мест ограничено, регистрация скоро будет закрыта – спешите…

Личные инструменты