Математические методы анализа текстов (курс лекций) / осень 2019
Материал из MachineLearning.
(Различия между версиями)
(→Программа курса) |
|||
Строка 29: | Строка 29: | ||
* Правила выставления итоговой оценки появятся позднее. | * Правила выставления итоговой оценки появятся позднее. | ||
==Программа курса== | ==Программа курса== | ||
+ | |||
+ | {|class = "standard" | ||
+ | ! № !! Тема !! Материалы !! Д/З | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 1 | ||
+ | | Введение в область анализа текстов (Natural Language Processing). Обзор основных задач. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 2 | ||
+ | | Предобработка данных. Простейшие модели классификации. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 3 | ||
+ | | Векторные представления слов. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 4 | ||
+ | | Задача теггинга последовательности. Графические модели для теггинга. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 5 | ||
+ | | Задача теггинга последовательности. Нейросетевые и комбинированные модели для теггинга. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 6 | ||
+ | | Языковое моделирование. Генерация текста на естественном языке. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 7 | ||
+ | | Модель sequence-to-sequence в машинном переводе и других приложениях. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 8 | ||
+ | | Глубокие архитектуры представления предложений и документов. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 9 | ||
+ | | Синтаксический разбор и его применение в практических задачах. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 10 | ||
+ | | Задача классификации текстов. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 11 | ||
+ | | Тематическое моделирование. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 12 | ||
+ | | Сегментация и суммаризация текстов. | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 13 | ||
+ | | To be announced | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |- <!-- Новое занятие --> | ||
+ | | 14 | ||
+ | | To be announced | ||
+ | | | ||
+ | | | ||
+ | <!-- Конец занятия --> | ||
+ | |||
+ | |} | ||
==Страницы прошлых лет== | ==Страницы прошлых лет== |
Версия 19:20, 2 сентября 2019
|
В курсе рассматриваются основные задачи и математические методы обработки естественного языка.
Курс читается:
- студентам кафедры «Математические методы прогнозирования» ВМК МГУ с 2016 года
- студентам кафедры «Интеллектуальные системы» ФУПМ МФТИ с 2018 года
От студентов требуются знание курса машинного обучения, основ глубинного обучения, а также языка программирования Python.
Контакты
- Преподаватели курса: Воронцов К.В., Апишев М.А., Попов А.С.
- На ВМК занятия проходят в аудитории 72 по вторникам, начало в 10:30
- На ВЦ занятия проходят в аудитории ?? по средам, начало в ??
- По всем конструктивным вопросам пишите в telegram-чат ??
Правила сдачи курса
- В рамках курса предполагается четыре практических задания и экзамен.
- Практические задания сдаются в систему anytask (инвайт у преподавателя). Срок выполнения каждого задания — 2 недели. За каждое задание можно получить до 10-ти баллов. За каждый день просрочки назначается штраф 1 балл. Основной язык выполнения заданий — Python 3.
- Все практические задания выполняются самостоятельно. Любые работы, содержащие плагиат, оцениваются в 0 баллов.
- Правила сдачи экзамена появятся позднее.
- Правила выставления итоговой оценки появятся позднее.
Программа курса
№ | Тема | Материалы | Д/З |
---|---|---|---|
1 | Введение в область анализа текстов (Natural Language Processing). Обзор основных задач. | ||
2 | Предобработка данных. Простейшие модели классификации. | ||
3 | Векторные представления слов. | ||
4 | Задача теггинга последовательности. Графические модели для теггинга. | ||
5 | Задача теггинга последовательности. Нейросетевые и комбинированные модели для теггинга. | ||
6 | Языковое моделирование. Генерация текста на естественном языке. | ||
7 | Модель sequence-to-sequence в машинном переводе и других приложениях. | ||
8 | Глубокие архитектуры представления предложений и документов. | ||
9 | Синтаксический разбор и его применение в практических задачах. | ||
10 | Задача классификации текстов. | ||
11 | Тематическое моделирование. | ||
12 | Сегментация и суммаризация текстов. | ||
13 | To be announced | ||
14 | To be announced |
Страницы прошлых лет
2018 (ФУПМ МФТИ), 2018 (ВМК МГУ)
Дополнительные материалы
Литература
- Dan Jurafsky and James H. Martin Speech and Language Processing (3rd ed. draft)
- Stewen Bird et. al. Natural Language Processing with Python. 2-nd edition. 2016.
- Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных. НИУ ВШЭ, 2017.
- LxMLS summer school Practical guide on NLP in Python
Другие курсы по NLP