| 
				     | 
			
		| (76 промежуточных версий не показаны.) | 
| Строка 1: | 
Строка 1: | 
| - | [[Категория:Учебные курсы]]
  |   | 
| - | {{TOCright}}
  |   | 
|   |  |   |  | 
| - | '''Машинное обучение''' (англ. machine learning) - наука об алгоритмах, которые сами настраиваются на известных данных, выделяя их характерную структуру и взаимосвязи между ними, для их компактного описания, визуализации и последующего предсказания новых аналогичных данных. Наука является сравнительно молодой, поскольку многие алгоритмы автоматической настройки на данных являются вычислительно трудоемкими, и их применение стало возможным только с появлением высокопроизводительных вычислительных средств. Основной акцент курса сделан на задачах предсказания дискретных величин (классификация) и непрерывных величин (регрессия), хотя в курсе также подробно рассматриваются смежные области - эффективное снижение размерности пространства, выделение наиболее значимых признаков для предсказания, методы оценивания и сравнения вероятностных распределений. 
  |   | 
| - | 
  |   | 
| - | Курс читается студентам 3 курса кафедры «Математические методы прогнозирования» ВМиК МГУ, магистрам, зачисленным на эту кафедру, и не проходивших ранее аналогичных курсов, а также для всех желающих. На материал данного курса опираются последующие кафедральные курсы.
  |   | 
| - | 
  |   | 
| - | По изложению, рассматриваются математические основы методов, лежащие в их основе предположения о данных, взаимосвязи методов между собой и особенности их практического применения.
  |   | 
| - | 
  |   | 
| - | Курс сопровождается [[Машинное обучение (семинары, ВМК МГУ)|семинарами]], раскрывающими дополнительные темы курса и отрабатывающими навыки практического применения рассматриваемых методов. Практическое использование методов машинного обучения в основном будет вестись с использованием языка python и соответствующих библиотек для научных вычислений.
  |   | 
| - | 
  |   | 
| - | От студентов требуются знания линейной алгебры, математического анализа и теории вероятностей. Знание математической статистики, методов оптимизации и какого-либо языка программирования желательно, но не обязательно.
  |   | 
| - | 
  |   | 
| - | Курс во многом пересекается с [[Машинное обучение (курс лекций, К.В.Воронцов)|курсом К.В.Воронцова по машинному обучению]], с которым также рекомендуется ознакомиться.
  |   | 
| - | 
  |   | 
| - | =Программа курса=
  |   | 
| - | 
  |   | 
| - | ==Первый семестр==
  |   | 
| - | 
  |   | 
| - | ===Основные понятия и примеры прикладных задач.=== 
  |   | 
| - | [[Media:Kitov-ML-01-Introduction.pdf|Скачать презентацию]]
  |   | 
| - | 
  |   | 
| - | ===Метрические методы регрессии и классификации.===
  |   | 
| - | [[Media:Kitov-ML-02-Metric methods.pdf|Скачать презентацию]]<br>
  |   | 
| - | [[Media:Kitov-ML-03-Metric methods.pdf|Скачать презентацию (продолжение)]]
  |   | 
| - | 
  |   | 
| - | ===Методы решающих деревьев.===
  |   | 
| - | [[Media:Kitov-ML-04-Decision trees.pdf|Скачать презентацию]]<br>
  |   | 
| - | [[Media:Kitov-ML-05-Decision trees.pdf|Скачать презентацию (продолжение)]]
  |   | 
| - | 
  |   | 
| - | ===Оценивание моделей.===
  |   | 
| - | [[media:Kitov-ML-05-Model_evaluation.pdf|Скачать презентацию]]
  |   | 
| - | 
  |   | 
| - | ===Классификация линейными методами.===
  |   | 
| - | [[media:Kitov-ML-06-Linear_classification_I.pdf|Скачать презентацию]]<br>
  |   | 
| - | [[media:Kitov-ML-07-Linear_classification_II_2.pdf|Скачать презентацию (продолжение)]]
  |   | 
| - | 
  |   | 
| - | ===Линейная и нелинейная регрессия.===
  |   | 
| - | [[media:Kitov-ML-08-Regression.pdf|Скачать презентацию (обновлена 05.11.2015)]]
  |   | 
| - | 
  |   | 
| - | ===Обобщение методов через ядра.===
  |   | 
| - | [[media:Kitov-ML-09-Kernel methods.pdf|Скачать презентацию]]
  |   | 
| - | 
  |   | 
| - | ===Байесовская теория классификации.===
  |   | 
| - | Байесовский алгоритм классификации, минимизирующий цену. Случай одинаковых цен. Дискриминативные и генеративные модели. Частотный и байесовский подходы к оцениванию  неизвестных параметров. Генеративные модели классификации с гауссовскими внутриклассовыми распределениями: модели LDA, QDA и RDA (QDA с регуляризацией), а также виды упрощающих предположений о матрице внутриклассовых ковариаций. 
  |   | 
| - | '''- было на лекции 19.11.2015.'''
  |   | 
| - | 
  |   | 
| - | ===Методы работы с пропущенными данными. Метод наивного Байеса.===
  |   | 
| - | +мультиномиальная/биномиальная модель наивного Байеса для классификации текстов и преобразование TF-IDF.
  |   | 
| - | +разложение ожидаемого квадрата ошибки на смещение и дисперсию (bias-variance tradeoff).
  |   | 
| - | '''- было на лекции 26.11.2015.'''
  |   | 
| - | 
  |   | 
| - | ===Моделирование смесью распределений. ===
  |   | 
| - | EM-алгоритм. Доказательство неубывания правдоподобия для EM-алгоритма. Вывод EM-алгоритма для смеси нормальных распределений в векторном случае. Подходы к определению числа компонент. - '''было на лекции 03.12.2015.'''
  |   | 
| - | 
  |   | 
| - | ===Ядерное сглаживание для оценки плотности.===
  |   | 
| - | 
  |   | 
| - | ===Кластеризация.===
  |   | 
| - | K-средних. Инициализация EM-алгоритма кластеризацией. Мягкая кластеризация через EM-алгоритм.
  |   | 
| - | 
  |   | 
| - | ==Второй семестр==
  |   | 
| - | 
  |   | 
| - | ===Нейросети.===
  |   | 
| - | 
  |   | 
| - | ===Глубинное обучение. ===
  |   | 
| - | +Различные виды автоэнкодеров.
  |   | 
| - | 
  |   | 
| - | ===Методы отбора признаков.===
  |   | 
| - | 
  |   | 
| - | ===Ансамбли алгоритмов.=== 
  |   | 
| - | 
  |   | 
| - | ===Ансамбли алгоритмов (продолжение).===
  |   | 
| - | 
  |   | 
| - | ===Нелинейные методы снижения размерности.===
  |   | 
| - | 
  |   | 
| - | ===Коллаборативная фильтрация.===
  |   | 
| - | 
  |   | 
| - | ===Online machine learning.===
  |   | 
| - | 
  |   | 
| - | ===Теория переобучения и оценки обобщающей способности прогнозирующих алгоритмов.===
  |   | 
| - | 
  |   | 
| - | ===Оптимизация процесса построения модели. Active learning.===
  |   | 
| - | 
  |   | 
| - | ===Reinforcement learning.===
  |   |