Математические методы анализа текстов (ВМиК МГУ) / 2017

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Введение.)
(Введение.)
Строка 12: Строка 12:
==Лекции==
==Лекции==
-
===Введение.===
+
===Токенизация. Коллокации. Регулярные выражения. ===
-
[[Media:01-Working_with_raw_text.pdf|Скачать презентацию (eng)]]
+
[[Media:01-MMP-Tokenization._Collocations._Regular_expressions.pdf‎|Скачать презентацию]]
-
[https://web.stanford.edu/~jurafsky/slp3/2.pdf Detailed materials]
+
[https://web.stanford.edu/~jurafsky/slp3/2.pdf Дополнительная информация]
= Материалы =
= Материалы =

Версия 12:05, 12 февраля 2017

Содержание

Курс посвящен методам автоматической обработки текстов, используя методы статистики и машинного обучения.

Курс читается магистрам 1го года кафедры «Математические методы прогнозирования» ВМиК МГУ, а также всем желающим.


Программа курса

Лекции

Токенизация. Коллокации. Регулярные выражения.

Скачать презентацию

Дополнительная информация

Материалы

Учебники

Speech and Language Processing. Dan Jurafsky and James H. Martin. 2-nd edition. 2009.

Natural Language Processing with Python. Stewen Bird et. al. 2-nd edition. 2016.

Juravsky, Manning - Video lectures on natural language processing.

Питон и необходимые библиотеки


Библиотеки по работе с текстами

Личные инструменты