Математические методы анализа текстов (ВМиК МГУ) / 2017
Материал из MachineLearning.
(Различия между версиями)
(→Введение.) |
(→Введение.) |
||
Строка 12: | Строка 12: | ||
==Лекции== | ==Лекции== | ||
- | === | + | ===Токенизация. Коллокации. Регулярные выражения. === |
- | [[Media:01- | + | [[Media:01-MMP-Tokenization._Collocations._Regular_expressions.pdf|Скачать презентацию]] |
- | [https://web.stanford.edu/~jurafsky/slp3/2.pdf | + | [https://web.stanford.edu/~jurafsky/slp3/2.pdf Дополнительная информация] |
= Материалы = | = Материалы = |
Версия 12:05, 12 февраля 2017
|
Курс посвящен методам автоматической обработки текстов, используя методы статистики и машинного обучения.
Курс читается магистрам 1го года кафедры «Математические методы прогнозирования» ВМиК МГУ, а также всем желающим.
Программа курса
Лекции
Токенизация. Коллокации. Регулярные выражения.
Материалы
Учебники
Speech and Language Processing. Dan Jurafsky and James H. Martin. 2-nd edition. 2009.
Natural Language Processing with Python. Stewen Bird et. al. 2-nd edition. 2016.
Juravsky, Manning - Video lectures on natural language processing.
Питон и необходимые библиотеки
- Anaconda - дистрибутив питона с предустановленными научными библиотеками
- библиотека NLTK по работе с текстами
- A Crash Course in Python for Scientists
- Numpy
- Matplotlib
- Scipy Lecture Notes
- Pandas
- Scikit-learn