Алгоритмы, модели, алгебры (курс лекций, Ю.И. Журавлев, А.Г. Дьяконов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Содержание курса)
(Содержание курса)
(166 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
== АЛГОРИТМЫ, МОДЕЛИ, АЛГЕБРЫ (название условное, курс посвящён анализу данных) ==
+
== ПРИКЛАДНЫЕ ЗАДАЧИ АНАЛИЗА ДАННЫХ (курс для магистров ММП ВМК МГУ) ==
* Обязательный курс для магистров каф. [[ММП]] 1 г/о, читается в 1-м (9-м) семестре.
* Обязательный курс для магистров каф. [[ММП]] 1 г/о, читается в 1-м (9-м) семестре.
-
* Лекции — 32 часа, семинаров - 32 часа.
+
* Лекции — 36 часов, семинаров - 36 часов.
* Экзамен.
* Экзамен.
* За курс отвечает кафедра Математических методов прогнозирования.
* За курс отвечает кафедра Математических методов прогнозирования.
Строка 11: Строка 11:
{{notice|
{{notice|
-
Напоминаю, о наших договорённостях:
+
'''Как будет проходить экзамен:'''
 +
 
* Есть система штрафных баллов, по ней формируется итоговая оценка.
* Есть система штрафных баллов, по ней формируется итоговая оценка.
* Пороги для конкретных оценок (по сумме баллов) объявлены изначально, но могут быть откорректированы лектором в пользу студентов.
* Пороги для конкретных оценок (по сумме баллов) объявлены изначально, но могут быть откорректированы лектором в пользу студентов.
* Сам экзамен проводится письменно - на нём (при желании) можно улучшить итоговую оценку
* Сам экзамен проводится письменно - на нём (при желании) можно улучшить итоговую оценку
 +
 +
хорошее написание письменного экзамена увеличивает итоговую оценку на 1 балл (порог будет заранее объявлен), безупречное написание - на 2 балла.
 +
 +
* Итоговая "отлично" ставится автоматом.
 +
* Итоговая "неудовлетворительно" также ставится автоматом и означает недопуск к экзамену, чтобы получить допуск надо сдать все несданные задания (итоговая оценка при этом не меняется и может быть исправлена только на самом экзамене). Перечень заданий для допуска определяется персонально с учётом заданий, сданных во время семестра.
 +
'''Содержание экзамена:''' задания эквивалентные заданиям со всех контрольных и семинаров (плюс задания по спектральной теории графов, плюс задания на знания теории и определений, если они были на лекциях и продублированы в списке рекомендуемой литературы, плюс задания на знания языков/библиотек, если они обсуждались на семинарах и лекциях)
'''Содержание экзамена:''' задания эквивалентные заданиям со всех контрольных и семинаров (плюс задания по спектральной теории графов, плюс задания на знания теории и определений, если они были на лекциях и продублированы в списке рекомендуемой литературы, плюс задания на знания языков/библиотек, если они обсуждались на семинарах и лекциях)
-
'''Исправление:''' хорошее написание письменного экзамена увеличивает итоговую оценку на 1 балл (порог будет заранее объявлен), безупречное написание - на 2 балла.
 
-
* Итоговая "отлично" ставится автоматом.
+
 
-
* Итоговая "неудовлетворительно" также ставится автоматом и означает недопуск к экзамену, чтобы получить допуск надо сдать все несданные задания (итоговая оценка при этом не меняется и может быть исправлена только на самом экзамене).
+
* Экзамен проходит по жёсткой схеме: нельзя пользоваться ничем (кроме ручки и листка бумаги). Аналогично контроль сдаваемых заданий после окончания семестра жёсткий: лектор уже не консультирует по самим заданиям, презентации оцениваются по формальным критериям: наличие постановки задачи, описание предложенных методов, их обоснование, подробное изложение экспериментов (с графиками и таблицами), формирование итоговой модели, выводы. Оценивается и сам доклад по задаче!
* Экзамен проходит по жёсткой схеме: нельзя пользоваться ничем (кроме ручки и листка бумаги). Аналогично контроль сдаваемых заданий после окончания семестра жёсткий: лектор уже не консультирует по самим заданиям, презентации оцениваются по формальным критериям: наличие постановки задачи, описание предложенных методов, их обоснование, подробное изложение экспериментов (с графиками и таблицами), формирование итоговой модели, выводы. Оценивается и сам доклад по задаче!
-
 
-
Все вопросы, связанные с АМА должны быть заданы в [https://inclass.kaggle.com/c/msuedges/forums/t/18146/- этой ветке].
 
}}
}}
Строка 64: Строка 67:
== Содержание курса ==
== Содержание курса ==
-
Наполняется по мере необходимости.
 
-
{| class="wikitable"
+
В этом году все материалы выкладываются здесь: https://github.com/Dyakonov/PZAD.
-
|-
+
-
! Число
+
-
! Занятие
+
-
! Тема
+
-
! Замечания
+
-
|-
+
-
| 01.09.15
+
-
| лекция
+
-
| '''Вводное занятие''': цели курса, материалы, правила, участие в соревнованиях.
+
-
|
+
-
|-
+
-
| 01.09.15
+
-
| семинар
+
-
| Тест на знание основ машинного обучения.
+
-
|
+
-
|-
+
-
| 01.09.15
+
-
| дз
+
-
| Регистрация на платформе kaggle.com (каждый участник в четверг должен иметь действующий логин), регистрация на данном ресурсе (по возможности), исследование платформы kaggle (уметь назвать несколько задач с платформы, их постановку, функционал качества, методы, которые использовали участники).
+
-
|
+
-
|-
+
-
| 08.09.15
+
-
| лекция
+
-
| '''Оценка среднего и вероятности'''
+
-
материалы:
+
Сдача ДЗ:
-
# Книга [http://www.ozon.ru/context/detail/id/4526400/ Шурыгин А.М. Математические методы прогнозирования // М., Горячая линия — Телеком, 2009, 180 с.] * Неплохие идеи для решения некоторых практических задач статистики (но в целом, специфична)
+
* Необязательное (лекция-1): https://www.kaggle.com/c/pzadbabki/discussion/65863/
-
# Статья [http://bijournal.hse.ru/2014--1%20%2827%29/120486363.html  Дьяконов А.Г. Прогноз поведения клиентов супермаркетов с помощью весовых схем оценок вероятностей и плотностей // Бизнес-информатика. 2014. № 1 (27). С. 68–77.].
+
* Игра "Что за данные" ('''к 23.09.2018'''): https://www.kaggle.com/c/pzadbabki/discussion/66104
-
# Видео [https://vimeo.com/119925869 Оценка вероятности: когда к нам придёт клиент?]
+
* Необязательное (лекция-2): https://www.kaggle.com/c/pzadbabki/discussion/65863 (та же ветка, что и для 1й)
-
|
+
* Визуализация внешних данных ('''к 30.09.2018'''): - https://www.kaggle.com/c/pzadbabki/discussion/66107
-
|-
+
-
| 08.09.15
+
-
| лекция
+
-
|
+
-
|
+
-
|-
+
-
| 08.09.15
+
-
| дз
+
-
| '''Первое домашнее задание:'''
+
-
Решение задачи [[https://inclass.kaggle.com/c/msusums]].
+
Все вопросы можно задавать в соответствующих ветках форума.
-
Срок - '''до 21 сентября 2015 23:59''' (с выкладкой отчёта в [[https://inclass.kaggle.com/c/msusums/forums/t/23145/2016/132732 этой ветке форума]]).
+
-
Все вопросы задаются в [[https://inclass.kaggle.com/c/msusums/forums/ форуме]].
+
== Успеваемость ==
-
Поощряется активность: выкладывание скриптов общего назначения (загрузка данных, перевод в нужный формат), бенчмарков (примитивные алгоритмы), ответы на вопросы в форуме.
+
Здесь будет рейтинг студентов...
-
'''до 14 сентября 2015 23:59 ''' - преодолеть порог 278.17435 в [[https://inclass.kaggle.com/c/msusums/leaderboard Public Liderboard]].
 
-
 
-
Напоминание: команды называть по шаблону '''''Ivan Ivanov (MMP, MSU, Russia)'''''.
 
-
| max штраф за задание -10.
 
-
Но дополнительно, за непреодоление бенчмарка -5.
 
-
|}
 
-
 
-
== Успеваемость ==
 
== Литература ==
== Литература ==
-
Указана локально - в сетке расписания.
+
Указана локально - в слайдах / сетке расписания.
== История ==
== История ==
Программы прошлых лет см. здесь:
Программы прошлых лет см. здесь:
 +
* [[Прикладные задачи анализа данных (курс на ВМК 2017 года)]]
 +
* [[Прикладные задачи анализа данных (курс на ВМК 2016 года)]]
* [[Алгоритмы, модели, алгебры (курс на ВМК 2015 года)]]
* [[Алгоритмы, модели, алгебры (курс на ВМК 2015 года)]]
* [[Алгоритмы, модели, алгебры (курс на ВМК до 2015 года)]]
* [[Алгоритмы, модели, алгебры (курс на ВМК до 2015 года)]]

Версия 10:19, 18 сентября 2018

Содержание

ПРИКЛАДНЫЕ ЗАДАЧИ АНАЛИЗА ДАННЫХ (курс для магистров ММП ВМК МГУ)

  • Обязательный курс для магистров каф. ММП 1 г/о, читается в 1-м (9-м) семестре.
  • Лекции — 36 часов, семинаров - 36 часов.
  • Экзамен.
  • За курс отвечает кафедра Математических методов прогнозирования.
  • Автор программы: профессор А. Г. Дьяконов.



Как будет проходить экзамен:
  • Есть система штрафных баллов, по ней формируется итоговая оценка.
  • Пороги для конкретных оценок (по сумме баллов) объявлены изначально, но могут быть откорректированы лектором в пользу студентов.
  • Сам экзамен проводится письменно - на нём (при желании) можно улучшить итоговую оценку

хорошее написание письменного экзамена увеличивает итоговую оценку на 1 балл (порог будет заранее объявлен), безупречное написание - на 2 балла.

  • Итоговая "отлично" ставится автоматом.
  • Итоговая "неудовлетворительно" также ставится автоматом и означает недопуск к экзамену, чтобы получить допуск надо сдать все несданные задания (итоговая оценка при этом не меняется и может быть исправлена только на самом экзамене). Перечень заданий для допуска определяется персонально с учётом заданий, сданных во время семестра.


Содержание экзамена: задания эквивалентные заданиям со всех контрольных и семинаров (плюс задания по спектральной теории графов, плюс задания на знания теории и определений, если они были на лекциях и продублированы в списке рекомендуемой литературы, плюс задания на знания языков/библиотек, если они обсуждались на семинарах и лекциях)


  • Экзамен проходит по жёсткой схеме: нельзя пользоваться ничем (кроме ручки и листка бумаги). Аналогично контроль сдаваемых заданий после окончания семестра жёсткий: лектор уже не консультирует по самим заданиям, презентации оцениваются по формальным критериям: наличие постановки задачи, описание предложенных методов, их обоснование, подробное изложение экспериментов (с графиками и таблицами), формирование итоговой модели, выводы. Оценивается и сам доклад по задаче!


Аннотация

Курс посвящён решению прикладных задач анализа данных. Разбираются реальные задачи и бизнес-кейсы. Студенты пишут и настраивают алгоритмы на языках Python, R, M (Matlab).

Семинары посвящены

  • докладам по решению прикладных задач (с презентациями),
  • опросам по выполнению домашнего задания,
  • обучению программированию на скриптовых языках (для тех, у кого их не было в бакалавриате),
  • мозговому штурму по решению задач и обсуждению решений,
  • написанию контрольных работ, решению аналитических задач, работе над ошибками.

Система оценивания

В течение семестра студенты получают задания.

При сдаче правильно выполненного задания в срок студент не получает штрафных баллов.

В противном случае - он получает от 1 до 10 штрафных баллов.

Штраф в 10 баллов допустим за позднюю сдачу (даже если решение верное) в случае отсутствия уважительных причин (болезнь, подтверждаемая справкой, и т.п. - см. требования учебной части).

В некоторых случаях (на усмотрение лектора), магистру, который лучше всех выполнил конкретное задание, списываются штрафные баллы (до 10).

На экзамене также за неверные ответы студент получает штрафные баллы.


Итоговая оценка формируется следующим образом:

  • до 10 штрафных баллов включительно - отлично,
  • до 20 штрафных баллов включительно - хорошо,
  • до 30 штрафных баллов включительно - удовлетворительно.

Содержание курса

В этом году все материалы выкладываются здесь: https://github.com/Dyakonov/PZAD.

Сдача ДЗ:

Все вопросы можно задавать в соответствующих ветках форума.

Успеваемость

Здесь будет рейтинг студентов...


Литература

Указана локально - в слайдах / сетке расписания.

История

Программы прошлых лет см. здесь:

Личные инструменты