Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Расписание)
(Расписание)
Строка 88: Строка 88:
|-
|-
| 25 октября
| 25 октября
-
|
+
| Workshop по BigARTM: простые и сложные примеры использования.
-
|
+
| Мурат Апишев
|
|
|-
|-
Строка 98: Строка 98:
|-
|-
| 8 ноября
| 8 ноября
-
| Word embeddings (про статьи Aurora, геометрию пространства и неработающие аналогии)
+
| Семинар по word embeddings
-
| Никита Шаповалов, Анна Потапенко
+
| TBD
|
|
|-
|-

Версия 19:40, 21 октября 2017

Это семинары по анализу текстов, открытые для всех желающих. Цель - быть в курсе современных подходов в области обработки текста на естественном языке (Natural Language Processing, NLP). На каждом семинаре у нас будет доклад и свободное обсуждение. Особенно часто будем обсуждать тематическое моделирование и глубокие нейронные сети.

Где и когда

Спецсеминар проводится по средам в 19.20 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2).

Проход строго по спискам! Записаться нужно здесь.

А потом придти на проходную около шлагбаума (не главный вход в Мамонтов) и показать паспорт.

Контакты

topicnet.slack.com -- слэк для людей, которые занимаются NLP, читают статьи, делятся друг с другом ссылками на интересные посты и датасеты.

artm_dev at googlegroups.com -- рассылка для студентов и аспирантов К.В. Воронцова, а также всех, кто как-то связан с проектом bigartm.org. Когда посылаете запрос на добавление, в "причине" напишите пару слов о себе.

anna.a.potapenko at gmail.com -- почта организатора семинара, пишите с предложениями и вопросами.

https://goo.gl/rc4grq -- короткая ссылка на эту страницу.

Расписание

Дата Тема Докладчик Материалы
16 августа Как вылезти из танка? Анна Потапенко Про Google и про ACL
30 августа Нейросетевые диалоговые системы в iPavlov

Задачи NER (РИС!) и Paraphrasing.

Михаил Бурцев и команда Три презентации, clickable :)
6 сентября Разборы статей: Google Vizier, Exploratory Search Роман Дербаносов, Дарья Соболева, Анастасия Янина Презентация про Vizier

[1], Pulp: A system for exploratory search of scientific literature

[2], Twitter-Network Topic Model: A Full Bayesian Treatment for Social Network and Text Modeling

13 сентября Вместо семинара воркшоп в вышке,

нужно зарегистрироваться

20 сентября — Как устроены рекомендательные системы

— Особенности ведения прикладных проектов

Виктор Кантор Рекомендательные системы
27 сентября — Разбор статьи StarSpace: Emded all the things!

— Как устроены вопросно-ответные системы

— Артем Попов

— Сергей Юдин

статья, презентация

Question Answering

4 октября — Проблема определения числа тем в тематических моделях.

— Термодинамический подход к результатам тематического моделирования.

— Константин Воронцов

— Сергей Кольцов

Презентация 1

Презентация 2

11 октября Ликбез с формулами: encoder-decoder architecture with attention.

Как это работает на практике: neural machine translation, summarization.

Анна Потапенко An overview of gradient descent optimization algorithms

Stronger Baselines for Trustable Results in Neural Machine Translation

18 октября — Get to the point! Summarization with pointer-generator networks

—Reinforcement learning for weak supervision in NLP

Анна Потапенко Get to the point

ACL-2017 keynotes

25 октября Workshop по BigARTM: простые и сложные примеры использования. Мурат Апишев
1 ноября Тезаурусы, лексические цепочки и тематические модели. Лукашевич Н.В. (НИВЦ МГУ)
8 ноября Семинар по word embeddings TBD
15 ноября Поиск: свежесть, блендеры, поисковые подсказки Алексей Шаграев (Яндекс)
Личные инструменты