Математические методы анализа текстов (курс лекций) / осень 2019

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Программа курса)
Строка 29: Строка 29:
* Правила выставления итоговой оценки появятся позднее.
* Правила выставления итоговой оценки появятся позднее.
==Программа курса==
==Программа курса==
 +
 +
{|class = "standard"
 +
! № !! Тема !! Материалы !! Д/З
 +
|- <!-- Новое занятие -->
 +
| 1
 +
| Введение в область анализа текстов (Natural Language Processing). Обзор основных задач.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 2
 +
| Предобработка данных. Простейшие модели классификации.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 3
 +
| Векторные представления слов.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 4
 +
| Задача теггинга последовательности. Графические модели для теггинга.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 5
 +
| Задача теггинга последовательности. Нейросетевые и комбинированные модели для теггинга.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 6
 +
| Языковое моделирование. Генерация текста на естественном языке.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 7
 +
| Модель sequence-to-sequence в машинном переводе и других приложениях.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 8
 +
| Глубокие архитектуры представления предложений и документов.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 9
 +
| Синтаксический разбор и его применение в практических задачах.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 10
 +
| Задача классификации текстов.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 11
 +
| Тематическое моделирование.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 12
 +
| Сегментация и суммаризация текстов.
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 13
 +
| To be announced
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
|- <!-- Новое занятие -->
 +
| 14
 +
| To be announced
 +
|
 +
|
 +
<!-- Конец занятия -->
 +
 +
|}
==Страницы прошлых лет==
==Страницы прошлых лет==

Версия 19:20, 2 сентября 2019

Содержание

В курсе рассматриваются основные задачи и математические методы обработки естественного языка.

Курс читается:

От студентов требуются знание курса машинного обучения, основ глубинного обучения, а также языка программирования Python.

Контакты

  • Преподаватели курса: Воронцов К.В., Апишев М.А., Попов А.С.
  • На ВМК занятия проходят в аудитории 72 по вторникам, начало в 10:30
  • На ВЦ занятия проходят в аудитории ?? по средам, начало в ??
  • По всем конструктивным вопросам пишите в telegram-чат ??

Правила сдачи курса

  • В рамках курса предполагается четыре практических задания и экзамен.
  • Практические задания сдаются в систему anytask (инвайт у преподавателя). Срок выполнения каждого задания — 2 недели. За каждое задание можно получить до 10-ти баллов. За каждый день просрочки назначается штраф 1 балл. Основной язык выполнения заданий — Python 3.
  • Все практические задания выполняются самостоятельно. Любые работы, содержащие плагиат, оцениваются в 0 баллов.
  • Правила сдачи экзамена появятся позднее.
  • Правила выставления итоговой оценки появятся позднее.

Программа курса

Тема Материалы Д/З
1 Введение в область анализа текстов (Natural Language Processing). Обзор основных задач.
2 Предобработка данных. Простейшие модели классификации.
3 Векторные представления слов.
4 Задача теггинга последовательности. Графические модели для теггинга.
5 Задача теггинга последовательности. Нейросетевые и комбинированные модели для теггинга.
6 Языковое моделирование. Генерация текста на естественном языке.
7 Модель sequence-to-sequence в машинном переводе и других приложениях.
8 Глубокие архитектуры представления предложений и документов.
9 Синтаксический разбор и его применение в практических задачах.
10 Задача классификации текстов.
11 Тематическое моделирование.
12 Сегментация и суммаризация текстов.
13 To be announced
14 To be announced

Страницы прошлых лет

2018 (ФУПМ МФТИ), 2018 (ВМК МГУ)

2017 (ВМК МГУ)

Дополнительные материалы

Литература

Другие курсы по NLP