Математические методы анализа текстов (курс лекций) / осень 2019

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Программа курса)
(Контакты)
(7 промежуточных версий не показаны.)
Строка 9: Строка 9:
==Контакты==
==Контакты==
-
* Преподаватели курса: Воронцов К.В., Апишев М.А., Попов А.С.
+
* Преподаватели курса: [[Участник:Vokov|Воронцов К.В.]], Апишев М.А., [[Участник:Arti_lehtonen|Попов А.С.]]
* На ВМК занятия проходят в аудитории 72 по вторникам, начало в 10:30
* На ВМК занятия проходят в аудитории 72 по вторникам, начало в 10:30
-
* На ВЦ занятия проходят в аудитории ?? по средам, начало в ??
+
* В ФИЦ ИУ РАН занятия по средам, начало в 16:10
 +
 
 +
* По всем конструктивным вопросам пишите в [https://t.me/joinchat/B2UcORRlc1j_RpANlJi1Xg telegram-чат]
 +
 
 +
* Репозиторий со всеми материалами: [https://github.com/mmta-team/mmta_fall_2019 ссылка]
 +
 
 +
* Короткая ссылка на страницу курса: [https://clck.ru/J5PMZ ссылка]
-
* По всем конструктивным вопросам пишите в telegram-чат ??
 
-
 
==Правила сдачи курса==
==Правила сдачи курса==
Строка 35: Строка 39:
| 1
| 1
| Введение в область анализа текстов (Natural Language Processing). Обзор основных задач.
| Введение в область анализа текстов (Natural Language Processing). Обзор основных задач.
-
|
+
| [[media:mmta19intro.pdf|слайды]]
|
|
<!-- Конец занятия -->
<!-- Конец занятия -->
Строка 41: Строка 45:
| 2
| 2
| Предобработка данных. Простейшие модели классификации.
| Предобработка данных. Простейшие модели классификации.
-
|
+
| [https://github.com/mmta-team/mmta_fall_2019/blob/master/02_preprocessing_and_simple_classification/preprocessing_simple_classification.pdf слайды]
|
|
<!-- Конец занятия -->
<!-- Конец занятия -->
Строка 47: Строка 51:
| 3
| 3
| Векторные представления слов.
| Векторные представления слов.
-
|
+
| [https://github.com/mmta-team/mmta_fall_2019/blob/master/03_word_embeddings/word_embeddings.pdf слайды]
|
|
<!-- Конец занятия -->
<!-- Конец занятия -->

Версия 19:15, 12 сентября 2019

Содержание

В курсе рассматриваются основные задачи и математические методы обработки естественного языка.

Курс читается:

От студентов требуются знание курса машинного обучения, основ глубинного обучения, а также языка программирования Python.

Контакты

  • На ВМК занятия проходят в аудитории 72 по вторникам, начало в 10:30
  • В ФИЦ ИУ РАН занятия по средам, начало в 16:10
  • По всем конструктивным вопросам пишите в telegram-чат
  • Репозиторий со всеми материалами: ссылка
  • Короткая ссылка на страницу курса: ссылка

Правила сдачи курса

  • В рамках курса предполагается четыре практических задания и экзамен.
  • Практические задания сдаются в систему anytask (инвайт у преподавателя). Срок выполнения каждого задания — 2 недели. За каждое задание можно получить до 10-ти баллов. За каждый день просрочки назначается штраф 1 балл. Основной язык выполнения заданий — Python 3.
  • Все практические задания выполняются самостоятельно. Любые работы, содержащие плагиат, оцениваются в 0 баллов.
  • Правила сдачи экзамена появятся позднее.
  • Правила выставления итоговой оценки появятся позднее.

Программа курса

Тема Материалы Д/З
1 Введение в область анализа текстов (Natural Language Processing). Обзор основных задач. слайды
2 Предобработка данных. Простейшие модели классификации. слайды
3 Векторные представления слов. слайды
4 Задача теггинга последовательности. Графические модели для теггинга.
5 Задача теггинга последовательности. Нейросетевые и комбинированные модели для теггинга.
6 Языковое моделирование. Генерация текста на естественном языке.
7 Модель sequence-to-sequence в машинном переводе и других приложениях.
8 Глубокие архитектуры представления предложений и документов.
9 Синтаксический разбор и его применение в практических задачах.
10 Задача классификации текстов.
11 Тематическое моделирование.
12 Сегментация и суммаризация текстов.
13 To be announced
14 To be announced

Страницы прошлых лет

2018 (ФУПМ МФТИ), 2018 (ВМК МГУ)

2017 (ВМК МГУ)

Дополнительные материалы

Литература

Другие курсы по NLP

Личные инструменты