Участник:Vokov

Материал из MachineLearning.

Версия от 18:09, 22 мая 2026; Vokov (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Содержание

    Воронцов Константин Вячеславович

профессор РАН, д.ф.-м.н.,
проф., зав. каф. «Математические методы прогнозирования» ВМК МГУ,
зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ
зав. каф. «Машинного обучения и цифровой гуманитаристики» МФТИ,
проф. каф. «Интеллектуальные системы» МФТИ (см.также),
г.н.с. отдела «Интеллектуальные системы» Вычислительного центра ФИЦ ИУ РАН,
один из идеологов и Администраторов ресурса MachineLearning.RU,
подробнее — на подстранице Curriculum vitæ.

Мне можно написать письмо.

http://www.MachineLearning.ru/wiki?title=User:Vokov — короткая ссылка на эту страницу.

Учебные материалы

Курсы лекций

Рекомендации для студентов и аспирантов

Каждый студент, с которым мы начинаем совместную научную работу, должен внимательно прочитать и осмыслить:

Другие методические материалы:

Популяризация науки

Видео, подкасты

Лонгриды

Российский радиоуниверситет, Радио России

Блог «Цивилизационная идеология»

  • Дзен-канал Цивилизационная идеология начался с попытки найти ответ на личный вопрос «чем заниматься, а чем не заниматься в области искусственного интеллекта». Ответ на этот вопрос не даёт ни математика, ни инженерная практика, ни решение частных прикладных задач. Поиск ответа уводит в сферу визионерства, требует погружения в мало изведанные (для нас, технарей) увлекательные области — историю науки, философию, аксиологию, этику, антропологию, социологию, психологию, эволюционную биологию. Начинайте мыслить шире с цивилизационной идеологией!

О цивилизации

О технологиях

О познании

О политике

Доклады на конференциях и семинарах

2026

  • 3 апреля 2026. Мастерская знаний: информационная среда будущего для коллективного поиска, понимания, систематизации, производства и передачи научных знаний. Научно-практическая конференция Science Analytics 2026: статистика, аналитика и оценка научных исследований. (PDF, 8.8 МБ).
  • 25 февраля 2026. Машинное обучение и семантический анализ. Научный семинар «Цифровая среда», Институт цифровых гуманитарных исследований Сибирского федерального университета. (PDF, 15 МБ).
  • 18 февраля 2026. Мастерская знаний: от поиска информации к пониманию и систематизации научных знаний. Всероссийская конференция «Актуальные проблемы семантического анализа данных». (PDF, 8.8 МБ).
  • 28 января 2026. Тематические и нейросетевые вероятностные языковые модели: курс на сближение. Проблемы искусственного интеллекта — совместный научный семинар Российской ассоциации искусственного интеллекта и ФИЦ «Информатика и управление» РАН. (PDF, 7.3 МБ). Видеозапись.

2025

  • 16 декабря 2025. Искусственный интеллект как фактор изменения цивилизации. Заседание круглого стола в Общественной палате РФ на тему «Использование искусственного интеллекта в креативной индустрии» (PDF, 0.8 МБ).
  • 3 декабря 2025. Карты знаний: инструмент представления знаний и коллективного мышления. «Коллективный интеллект: Современная управленческая практика взаимодействия людей и ИИ. Семинар компании RConf». (HTML.ZIP, 9.8 МБ).
  • 30 ноября 2025. Юрий Иванович Журавлёв. У истоков искусственного интеллекта. День математика, ВМК. (PDF, 8.3 МБ).
  • 29 ноября 2025. Вероятностное тематическое моделирование в эпоху больших языковых моделей. Научная конференция «Численное моделирование в механике сплошных сред», посвящённая 100-летию со дня рождения академика О.М.Белоцерковского, секция «Машинное обучение и искусственный интеллект». (PDF, 5.9 МБ).
  • 19 ноября 2025. Презентация книги «Вероятностное тематическое моделирование: Теория регуляризации ARTM и библиотека с открытым кодом BigARTM». URSS, 2025. Научный семинар «Проблемы управления знаниями», ИПУ РАН. (PDF, 5.7 МБ).
  • 14 ноября 2025. Искусственный интеллект: от персональных помощников к цифровому послесмертию. Ежегодная XV международная конференция по научно-технической политике и форсайту, ВШЭ. (PDF, 1.4 МБ).
  • 11 ноября 2025. Основы ИИ: история развития, ключевые компоненты, вызовы, угрозы, возможности и ограничения ИИ (обзорная лекция). Программа дополнительного профессионального образования – программа повышения квалификации «Применение технологий искусственного интеллекта в процессах деятельности органов государственной власти и предприятий промышленности» для сотрудников региональных органов исполнительной власти в сфере промышленности и торговли и сотрудников Министерства промышленности и торговли Российской Федерации. (PDF, 6.1 МБ).
  • 15 октября 2025. От регламента технологического конкурса ПРО//ЧТЕНИЕ к машинному обучению моделей контент-анализа по несогласованным экспертным разметкам. Научный семинар «Проблемы управления знаниями», ИПУ РАН. (PDF, 4.1 МБ).
  • 9 октября 2025. Проект поисково-рекомендательной системы (мастерская знаний). XXII Национальная конференция по искусственному интеллекту с международным участием КИИ-2025. (HTML.ZIP, 19Мб).
  • 8 октября 2025. Как технологии ИИ меняют мир? — А как бы нам хотелось? Выступление на Science Slam Института ИИ МГУ. (PDF, 0.6Мб).
  • 25 сентября 2025. Мастерская знаний: как большие языковые модели меняют подходы к поиску научной информации. 22-я Всероссийская конференция «Математические методы распознавания образов». (PDF, 15Мб).
  • 25 сентября 2025. Что надо знать об искусственном интеллекте: история, методология, возможности, ограничения (обзорная лекция). Муромский институт ВлГУ — открытая лекция в рамках 22-й Всероссийской конференция «Математические методы распознавания образов». (PDF, 5.6Мб).
  • 24 сентября 2025. От информационного поиска к управлению знаниями: как технологии LLM меняют стиль работы с научной информацией. 18-я международная конференция «Управление развитием крупномасштабных систем» MLSD-2025, 24-26 сентября 2025, ИПУ РАН. (PDF, 5.0Мб). Видеозапись.
  • 23 сентября 2025. Искусственный интеллект: из прошлого через будущее в настоящее. День технологий будущего, компания ЮниРусь. (PDF, 5.2Мб).
  • 28 августа 2025. Куда ИИ заведёт человечество, и как пройти сингулярность, оставаясь умнее машин. Форум⁠ «Территория будущего. Москва 2030». (PDF, 2.7Мб). Видеозапись.
  • 9 августа 2025. Теория вероятностного тематического моделирования больших текстовых коллекций. Летняя школа РАИИ, Тольятти. (PDF, 5.0Мб).
  • 9 июля 2025. Оптимизация на единичных симплексах для обучения монотонных нейронных сетей, матричных разложений и вероятностных тематических моделей. XXIV International conference “Mathematical Optimization Theory and Operations Research” (MOTOR 2025). Novosibirsk Scientific Center, Russia. (PDF, 4.1Мб).
  • 1 июля 2025. Карты знаний: на пути к доверенной информационной среде коллективного человеко-машинного разума. Международная научная конференция XVI Академические чтения, посвященные 100-летию академика РААСН В.М.Бондаренко и 96-летию академика РААСН Г.Л.Осипова «Актуальные вопросы строительcтва. Надежность строительных конструкций. Энергосбережение. Экологическая безопасность. Искусственный интеллект». (PDF, 3.4Мб). (PNG, 3.5Мб).
  • 27 июня 2025. Введение в машинное обучение. Летняя физико-математическая школа «Квант» 2025. (PNG, 4.6Мб).
  • 23 июня 2025. Оптимизация вероятностных тематических моделей текста: от «мешка слов» к моделям внимания. Традиционная молодежная летняя школа «Управление, информация и оптимизация» им. Б. Т. Поляка. (PDF, 4.6Мб). Видеозапись.
  • 23 июня 2025. Цивилизационное мировоззрение. Третья летняя сретенская конференция. (PNG, 4.8Мб). Видеозапись.
  • 17 июня 2025. Введение в машинное обучение. Всероссийская конференция и школа молодых учёных с международным участием по вычислительно-информационным технологиям для наук об окружающей среде CITES-2025, 16–26 июня 2025, Москва. (PNG, 6.0Мб).
  • 31 мая 2025. Как образы будущего человеко машинной цивилизации формируют сегодняшнюю повестку и постановки задач в области ИИ. Гравитация-2025: Международная университетская премия в области искусственного интеллекта и больших данных. (PDF, 1.1Мб).
  • 25 апреля 2025. Методология многокритериальной оценки текстовой разметки моделей на основе несогласованной экспертной разметки. Международная конференция по компьютерной лингвистике и интеллектуальным технологиям ДИАЛОГ-2025. (PDF, 1.8Мб).
  • 16 апреля 2025. Футурология искусственного интеллекта: от персонального помощника к цифровому послесмертию. Data Fusion 2025. (PDF, 2.7Мб). Видеозапись.
  • 9 апреля 2025. Футурология ИИ: как персональные помощники будут влиять на социально-экономическое развитие. Ломоносовские чтения, экономический факультет МГУ. (PDF, 2.5Мб).
  • 28 марта 2025. Towards bridging the gap between Probabilistic Topic Models and Large Language Models. MathAI-2025 Int. Conf. Mathematics in Artificial Intelligence. Sirius International Mathematical Center, Sochi, 24–28 March 2025. (PDF, 2.3Мб).
  • 20 марта 2025. Оптимизация на единичных симплексах для обучения тематических моделей и нейронных сетей. «Data science: mathematical foundations and applications in medicine» — научный семинар лаборатории «Вероятностные методы в анализе» факультета математики и компьютерных наук, СПбГУ. (PDF, 4.4Мб).
  • 10 февраля 2025. История развития искусственного интеллекта: вклад Джеффри Хинтона, нобелевского лауреата и «отца глубокого обучения». Нобелевские лекции, Минск, Беларусь. (PDF, 5.1Мб).
  • 6 февраля 2025. Дао искусственного интеллекта: от персонального помощника к цифровому послесмертию. День российской науки в РАНХиГС, экспертный круглый стол «Актуальные направления исследований в области искусственного интеллекта». (PDF, 1.2Мб).

2024

2023

2022

  • 7 декабря 2022. Задачи понимания естественного языка: на пути к стандартизации разметки и оценивания моделей. Секционное научно-методическое заседание «Межотраслевые вопросы стандартизации искусственного интеллекта» Подкомитета 02 «Данные» (ПК02) Технического комитета по стандартизации «Искусственный интеллект» (ТК164), в рамках конференции ИОИ-14. (PDF, 2.4Мб).
  • 6 декабря 2022. От алгебраического подхода Ю.И.Журавлёва к ансамблированию моделей в широком смысле. Интеллектуализация обработки информации (конференция). (PDF, 2.9Мб).
  • 28 ноября 2022. Обзор оптимизационных задач машинного обучения: от персептрона до векторных представлений сложно структурированных данных. Научный симпозиум «Искусственный интеллект и его применения». Институт ИИ МГУ. (PDF, 3.6Мб).
  • 25 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. Школа прикладного анализа больших данных. Томский государственный университет. (PDF, 2.5Мб). Видеозапись.
  • 11 ноября 2022. Разметка данных для обучения нейросетевых моделей языка как способ формализации гуманитарных знаний. XVIII научная конференция межрегиональной ассоциации «История и компьютер» Историческая информатика как Historical Data Science. (PDF, 2.5Мб).
  • 27 октября 2022. Обзор задач искусственного интеллекта: от обучения персептрона до многокритериальной оптимизации векторных представлений сложно структурированных данных. Семинар Отделения математических наук РАН по проблемам искусственного интеллекта. (PDF, 3.7Мб). Видеозапись.
  • 12 октября 2022. Стандартизация разметки текста и оценивания предсказательных моделей в задачах понимания естественного языка. Конгресс «Humanities vs sciences & the knowledge accelerating in modern world: parallels and interaction». (PDF, 2.2Мб). Видеозапись.
  • 8 октября 2022. Искусственный интеллект: мифы, реальность, перспективы. Всероссийский Фестиваль «Наука 0+». (PDF, 5.1Мб).
  • 16 августа 2022. Обучаемая векторизация данных как основа нейросетевых технологий искусственного интеллекта. Международный военно-технический форум «АРМИЯ-2022». Секция №3 «Научная проблематика в области искусственного интеллекта» (PDF, 4.8Мб).
  • 20 мая 2022. Технологии искусственного интеллекта и безопасность информационного пространства. Международный конгресс Университетского консорциума исследователей больших данных. г.Киров, ВятГУ. (PDF, 1.7Мб). Видеозапись.
  • 20 мая 2022. Технологии искусственного интеллекта против фейков, постправды и информационных войн. Заседание Экспертного совета по развитию цифровой экономики, технологий и инноваций Молодёжного парламента при Государственной думе Федерального Собрания РФ по теме «Защита суверенного информационного пространства: правовые, научно-технические и организационные меры». (PDF, 1.6Мб).
  • 18 мая 2022. Вероятностные тематические модели: от теории регуляризации к моделям внимания. XII Международная молодёжная научно-практическая конференция с элементами научной школы «Прикладная математика и фундаментальная информатика». Омский ГТУ. (PDF, 7.1Мб).
  • 17 мая 2022. Современные методы и проблемы тематического моделирования и разведочного поиска. Ежегодная конференция Российской библиотечной ассоциации XXVI. Совместное заседание: секция 08/11 по автоматизации, форматам и каталогизации 23-К. (PDF, 1.7Мб). Видеозапись.
  • 14 апреля 2022. Технологии искусственного интеллекта против политики постправды. Международная научно-практическая конференция «Цифровые международные отношения». Секция «Машинный анализ естественного языка в международных отношениях». (PDF, 1.5Мб). Видеозапись.
  • 17 марта 2022. Тематическое моделирование для информационного поиска. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. (PDF, 2.7Мб). Видеозапись.
  • 31 января 2022. Задачи выявления речевых манипуляций и поляризации общественного мнения в новостных текстах. Научный семинар Центра прикладного анализа больших данных Томского государственного университета. (PDF, 1.1Мб). Видеозапись.
  • 7 января 2022. STEM-дисциплины (Science, Technology, Engineering, Math) – основа настоящего образования? Московская школа управления СКОЛКОВО, Образовательный интенсив «Ты. Университет. Будущее». (PDF, 2.8Мб).

2021

2020

2019

2018

2017

2016

2015

2014

2013

  • 31 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на семинаре БММО-2013, ВМК МГУ. (PDF, 1.6 МБ).
  • 7 октября 2013. Аддитивная регуляризация вероятностных тематических моделей. Доклад на конференции ММРО-16, Казань. (PDF, 1.1 МБ).
  • 2 октября 2013. Combinatorial theory of overfitting. How Connectivity and Splitting Reduces the Local Complexity Measures of Complexity Symposium (PDF, 1.7 MБ).
  • 27 сентября 2013. Combinatorial theory of overfitting. The Yandex School of Data Analysis conference (PDF, 1.7 MБ), Аннотация и видеозапись.
  • 28 июня 2013. Combinatorial theory of overfitting. International Workshop on Statistical Learning IWSL (PDF, 1.5 MБ).
  • 23 апреля 2013. Вероятностные тематические модели коллекций текстовых документов. Доклад на семинаре в ВИНИТИ РАН. (PDF, 2.0 МБ).
  • 13 апреля 2013. Комбинаторная теория переобучения. Семинар в НМУ. (PDF, 3.5 МБ). Дополнение: Евгений Соколов. Линейные классификаторы и случайные блуждания. (PDF, 380 KБ)
  • 26 февраля 2013. Вероятностные тематические модели коллекций текстовых документов. Просеминар кафедры ММП, Москва, МГУ. (PDF, 0.8 МБ).

2012

  • 26 сентября, 3 октября 2012. Четыре лекции по машинному обучению. Высшая Школа Экономики. (PDF, 2.9 МБ).
  • 17 сентября 2012. Регуляризация, робастность и разреженность вероятностных тематических моделей. Доклад на конференции ИОИ-9. (PDF, 0.9 МБ).
  • 24 мая 2012. Комбинаторная теория переобучения и её применения. Семинар лаборатории PreMoLab, Москва, ИППИ РАН. (PDF, 3.0 МБ).
  • 27 февраля 2012. Комбинаторная теория переобучения и её применения. Просеминар кафедры ММП, Москва, МГУ. (PDF, 2.5 МБ).

2011

  • 19 октября 2011. Задачи анализа данных ДНК-микрочипов. Доклад на семинаре «Время, хаос и математические проблемы» (руководитель академик В.А.Садовничий), Москва, МГУ. (PDF, 3 МБ).
  • 12 сентября 2011. Комбинаторная теория переобучения и поиск логических закономерностей. Доклад на конференции ММРО-15, Петрозаводск. (PDF, 1.4 МБ).
  • 27,29 июня 2011. Recent Advances on Generalization Bounds. Tutorial. International conference PReMI-2011 Part 1 (PDF, 1.0 MБ), Part 2 (PDF, 1.5 MБ). Tight Combinatorial Generalization Bounds for Threshold Conjunction Rules (PDF, 0.6 MБ, на английском).
  • 12 января 2011. Интеллектуальный анализ данных и объектно-ориентированное программирование. Лекция на Зимней компьютерной школе 2011, МФТИ. (PDF, 1.0 МБ).

2010

  • 7 ноября 2010. Generalization bounds based on the splitting and connectivity properties of a set of classifiers. International conference PRIA-10 (PDF, 1.4 MБ, на английском).
  • 20 октября 2010. Точные комбинаторные оценки обобщающей способности онлайнового обучения. Конференция ИОИ-8 (PDF, 400 KБ).
  • 18 октября 2010. Комбинаторный подход к выводу точных оценок вероятности переобучения. Конференция ИОИ-8 (PDF, 1.2 MБ).
  • 22 апреля 2010. Комбинаторная теория надёжности обучения по прецедентам. Защита докторской диссертации. (PDF, 1760 КБ). Учёный совет квалифицировал работу как новое направление в теории статистического обучения.
  • 3 марта 2010. Интеллектуальный анализ данных и распознавание образов. Теоретические и практические проблемы. Доклад на семинаре «Глобальные изменения климата» (руководители академик Г.И.Марчук, академик В.П.Дымников), Москва, ИВМ. (PDF, 828 КБ).
  • 13 января 2010. Задачи и методы машинного обучения. Лекция на Зимней компьютерной школе 2010, МФТИ. (PDF, 1023 КБ).

2009

  • 22 сентября 2009. Комбинаторный подход к проблеме переобучения. Доклад на конференции ММРО-14, Суздаль. (PDF, 1106 КБ).
  • 27 июля 2009. Методы машинного обучения, основанные на индукции правил (логические методы классификации). Доклад на семинаре Знания и онтологии ELSEWHERE, Москва, ВШЭ. (PDF, 1202 КБ).

2008

2003–2007

  • 30 сентября 2007. Слабая вероятностная аксиоматика и надёжность эмпирических предсказаний. Конференция ММРО-13. (PDF, 910 КБ).
  • 20 august 2007. 7th Open German/Russian Workshop (OGRW-7) on Pattern Recognition and Image Understanding, Ettlingen, Germany. Combinatorial Approach to Generalization Bounds Tightening. (PDF, 1.9 МБ, на английском).
  • 4 июня 2006. Прикладные исследования и разработки компании Форексис в области интеллектуального анализа данных. Конференция ИОИ-2006, Крым, Алушта. (PDF, 460 КБ)
  • 5 ноября 2005. Измерение локальной эффективной функции роста в задачах поиска логических закономерностей. Конференция ММРО-12. (PDF, 285 КБ), вместе с речью — (PDF, 308 КБ).
  • 14 июня 2004. Комбинаторный подход к оцениванию качества алгоритмов, обучаемых по прецедентам. Конференция ИОИ-2004, Крым, Алушта. (PDF, 520 КБ).
  • 28 ноября 2003. Комбинаторные оценки качества обучения по прецедентам. Конференция ММРО-11. (PDF, 680 КБ).

Научные интересы

Всё, что скрывается за терминами «науки о данных» (data science), «интеллектуальный анализ данных» (data mining) и «машинное обучение» (machine learning): распознавание образов, прогнозирование, математическая статистика, дискретная математика, численные методы оптимизации, аналитика больших данных, а также практический анализ данных в разнообразных областях (медицина, техника, биоинформатика, экономика, лингвистика, интернет).

Анализ текстов и информационный поиск

Современные средства текстового поиска предназначены для ответов на короткие текстовые запросы. Этого не достаточно при самообразовании и поиске научной информации, в особенности новой или содержащей неизвестную пользователю терминологию. Поиск и мониторинг новых тенденций, терминологии, профессиональных сообществ всё ещё требует больших затрат времени и высокой квалификации. Существует барьер входа в новую профессиональную область. Ответ на вопрос «где находится передний край науки по данной теме» по-прежнему достигается, главным образом, путём личного общения, следовательно, субъективен и не общедоступен. Наш подход к исследовательскому поиску (Exploratory Search) основан на концепции Мастерской Знаний. Это среда для поиска, анализа и переработки больших объёмов текстовой информации. В ней пользователь «мастерит» тематические текстовые подборки. Мастерская помогает ему расширять подборку, писать по ней рефераты и обзоры, выделять ключевые понятия и факты, систематизировать по темам, строить графические визуализации в виде «карты знаний». Миссия проекта — убирать барьеры между человеком и знанием. В Мастерской применяются разнообразные технологии обработки естественного языка (NLP).

Вероятностное тематическое моделирование (Probabilistic Topic Modeling) служит для выявления тематики больших текстовых коллекций и определения, к каким темам относится каждый текстовый документ. Также оно находит всё больше неожиданных применений в областях, далёких от анализа текстов: при обработке изображений и видео, звуковых и биомедицинских сигналов, нуклеотидных и аминокислотных последовательностей, пользовательских логов, финансовых и транзакционных данных.

Основные направления исследований и разработок

  • теория и методы аддитивной регуляризации тематических моделей (ARTM);
  • разработка BigARTM — библиотеки с открытым кодом для тематического моделирования больших коллекций;
  • разработка инструментальной среды для тематического моделирования TopicNet;
  • разработка поисково-рекомендательной системы SciSearch.ai;
  • автоматическое выделения терминов-словосочетаний в текстах;
  • тематические модели последовательного текста, тематической структуры и сегментации текстов;
  • мультимодальные тематические модели, классификация и регрессия с текстовыми и разреженными признаками;
  • иерархические тематические модели и категоризация текстов;
  • методы визуализации тематических моделей;
  • методы автоматического именования тем;
  • проблемы сходимости и устойчивости численных методов матричных и тензорных разложений;
  • проблемы интерпретируемости тем;
  • мультиязычные тематические модели;
  • тематические модели транзакционных данных или гиперграфов;
  • анализ тональности и разделение тем на полярные мнения;
  • темпоральные (динамические) тематические модели;
  • автоматическое оценивание когнитивной сложности текста;

Прикладные задачи

  • иерархическая тематическая модель научного и научно-популярного контента;
  • тематический исследовательский информационный поиск;
  • полуавтоматическое реферирование тематических подборок научных статей;
  • классификация и динамическая тематизация новостных потоков;
  • модели символьной динамики для анализа дискретных временных рядов;
  • тематическая кластеризация отзывов клиентов или опросов персонала;
  • классификация и сценарный анализ записей разговоров контактного центра;
  • выявления паттернов потребительского поведения клиентов по банковским транзакциям;
  • выявление видов экономической деятельности компаний по банковским транзакциям;

Ключевые слова

  • text analysis, information retrieval, keyphrase extraction, topic modeling, probabilistic latent semantic analysis (PLSA), latent Dirichlet allocation (LDA), Gibbs sampling, documents categorization, learning to rank, research trends, research front.

Материалы и задания

Технологии против постправды

Постправда — это политика игнорирования фактов, использования фейковых новостей и приёмов пропаганды для формирования общественного мнения. Опасность постправды в том, что она навязывает социуму ложную картину мира и вынуждает людей принимать невыгодные для них решения. Блогосфера и социальные сети способствуют распространению фейков, лженаучных и мифологизированных представлений о мире. Средства массовой информации всё чаще используются для ведения информационных войн между корпорациями, государствами и идеологиями. Создание технологий, способных противостоять некритичному восприятию постправды, становится фундаментально важной задачей. Речь идёт об использовании технологий машинного обучения и автоматической обработки текстов для выявления манипулятивных приёмов, обмана, слухов, сплетен, мистификаций, противоречий, замалчивания, мифологизации и идеологизации. Мы называем эти явления потенциально опасным дискурсом. Их необходимо не только выявлять, но и оценивать степень их опасности, и на какие целевые аудитории направлено воздействие. Исследование носит междисциплинарный характер и предполагает тесное взаимодействие с лингвистами, журналистами, политологами, психологами.

Основные направления исследований и разработок:

  • распознавание фейков в новостях;
  • распознавание пропаганды и приёмов информационной войны;
  • поиск противоречивых оценок и интерпретаций одних и тех же событий в различных источниках;
  • выявление манипулятивных приёмов в тексте;
  • классификация психоэмоциональных реакций целевых аудиторий на текстовое сообщение;
  • выявление конструктов мифологизированной/идеологизированной картины мира (мифологем/идеологем);
  • модели классификации текстов, пар текстов и фрагментов текстов по размеченным выборкам;
  • методы активного обучения для формирования неразмеченных выборок в краудсорсинге;
  • разработка открытых библиотек для выявления и анализа потенциально опасного дискурса.

Материалы

Технологии против пандемии

В условиях пандемии перед производственными предприятиями и организациями встают вопросы: какие противоэпидемиологические мероприятия провести, чтобы минимизировать потери, избежать локдауна или максимально эффективно из него выйти. Кого в первую очередь тестировать, кого отправлять на карантин, кого вакцинировать, для всех ли сотрудников масочно-перчаточный режим строго обязателен. Ответы на эти вопросы не универсальны и зависят от структуры контактов на конкретном предприятии. В проекте используются данные о контактах, предоставленные компанией Софттри в рамках проекта Amuleit, для моделирования распространения инфекции по графу контактов и сравнения эффективности различных мероприятий. Для оценивания индивидуального риска инфицирования строятся вероятностные модели по обучающим выборкам, сформированным имитационной моделью распространения инфекции по графу контактов. Оценки индивидуального риска позволяют формировать приоритетные списки людей для тестирования и вакцинации, и тем самым существенно сокращать затраты и повышать эффективность противоэпидемических мероприятий.

Основные направления исследований и разработок:

  • имитационное моделирование распространения инфекции по заданному динамическому графу контактов;
  • имитационное моделирование для генерирования динамического графа контактов;
  • вероятностные модели риска с прямым и обратным отслеживанием контактов;
  • методы инкрементного обучения вероятностной модели индивидуального риска инфицирования;
  • оценивание результативности противоэпидемиологических мероприятий с помощью имитационного моделирования.

Материалы

Теория обобщающей способности

Проблема обобщающей способности является ключевой и в то же время наиболее сложной в машинном обучении. Её даже выделяют в отдельную дисциплину — теорию вычислительного обучения. Если алгоритм, восстанавливающий некоторую неизвестную зависимость, построен по конечной обучающей выборке прецедентов, то как предсказать качество его работы на контрольной выборке, состоящей из новых прецедентов? Почему это вообще возможно? Как надо обучать алгоритм, чтобы он редко ошибался на новых данных?

Активное исследование этих вопросов началось в конце 60-х, когда В.Н.Вапник и А.Я.Червоненкис предложили статистическую теорию восстановления зависимостей по эмпирическим данным (VC theory) и получили верхние оценки вероятности ошибки обученного алгоритма (VC-bounds). Эти оценки позволили обосновать давно замеченный эмпирический факт: по мере увеличения сложности используемого семейства алгоритмов качество обучения сначала улучшается, затем начинает ухудшаться. Ухудшение связано с эффектом переобучения. Если алгоритм имеет избыточное число параметров («степеней свободы»), то он может слишком точно настроиться на конкретную обучающую выборку в ущерб качеству восстановления зависимости в целом. В теории Вапника-Червоненкиса разработан метод структурной минимизации риска (СМР), позволяющий автоматически находить модель оптимальной сложности. К сожалению, оценки вероятности ошибки чрезвычайно завышены (осторожны, пессимистичны), что может приводить к переупрощению модели в методе СМР. Несмотря на 40-летние усилия многих ученых и существенное усложнение математического аппарата, точные оценки до сих пор не были получены.

Комбинаторная теория переобучения — это принципиально новый подход, основанный на слабой вероятностной аксиоматике, впервые позволивший получить точные (не завышенные, не асимптотические) комбинаторные оценки вероятности переобучения и показать ключевую роль эффектов расслоения и сходства в семействах алгоритмов. Пока что точные оценки получены лишь для ряда модельных семейств алгоритмов, обладающих некоторой регулярной структурой. Для реальных смейств удалось получить верхние оценки расслоения-связности — SC-оценки (splitting and connectivity bounds). Они завышены в разы, тогда как VC-оценки завышены на 5–8 порядков. Для некоторых модельных семейств SC-оценки являются точными. Тем не менее, проблемы остаются, и дело не только в завышенности оценок. Во-первых, SC-оценки могут быть ненаблюдаемыми, то есть в них могут входить некоторые функции от скрытых контрольных данных. Эти функции вполне можно оценивать по наблюдаемым обучающим данным, но это дополнительная работа. Во-вторых, SC-оценки могут быть вычислительно неэффективными и требовать неадекватно больших затрат памяти и времени. Получение приближённых или асимптотических SC-оценок гарантированной точности также является отдельной работой.

Пока имеется лишь два примера практического применения комбинаторных оценок обобщающей способности:

  • Модификация критериев информативности для уменьшения переобучения конъюнктивных закономерностей в логических алгоритмах классификации (Андрей Ивахненко).
  • Эффективный алгоритм отбора эталонных объектов в методе ближайших соседей (Максим Иванов).

Основная цель дальнейших исследований — доведение комбинаторной теории переобучения до уровня практической применимости.

Основные направления исследований:

  • разработка математической техники для перехода от ненаблюдаемых оценок к наблюдаемым (возможно, как на основе комбинаторики, так и на основе теории концентрации вероятностной меры);
  • исследование комбинаторно-статистических свойств графа расслоения-связности модельных и реальных семейств алгоритмов.
  • получение оценок вероятности переобучения через наблюдаемый профиль расслоения-связности;
  • разработка эффективных методов оценивания нижних слоёв профиля расслоения-связности в конкретных методах обучения;
  • разработка логических алгоритмов классификации с управляемой переобученностью логических закономерностей;
  • развитие понятия «плотности» семейства алгоритмов и изучение возможности аппроксимации «плотных» семейств их «разреженными» подсемействами малой мощности;
  • развитие понятия «комбинаторного отступа» и его использование для повышения обобщающей способности линейных классификаторов;
  • развитие понятия локальной радемахеровской сложности для более аккуратного учёта эффектов расслоения и сходства;
  • обобщение понятий расслоения и сходства алгоритмов для непрерывных функций потерь;
  • разработка эффективных метрических алгоритмов классификации на основе комбинаторных оценок полного скользящего контроля;
  • исследование связи профилей компактности с функциями конкурентного сходства;
  • разработка методики тестирования и анализа обобщающей способности для «Полигона алгоритмов классификации».

Материалы:

Ключевые слова: overfitting, generalization bounds, computational learning theory, Vapnik-Chervonenkis theory, local Rademacher complexity.

Комбинаторная (перестановочная) статистика

Это направление логично вытекает из предыдущего и является его обобщением. Оказывается, многие фундаментальные факты теории вероятностей и математической статистики можно переформулировать и доказать, не опираясь на колмогоровскую аксиоматику, то есть не используя теорию меры, и даже не употребляя само понятие вероятности. В задачах анализа данных мы всегда имеем дело с выборками конечной длины. Поэтому естественно ставить вопрос не «какова вероятность события?», а «какой может быть частота этого события на скрытых (пока еще не известных) данных?». Ответы на эти два вопроса, вообще говоря, различны, причем на выборках малой длины различие существенно. Вероятность события — абстрактная идеализированная величина. Частота события — это как раз то, что реально измеряется в эксперименте. Именно её и имеет смысл оценивать (предсказывать).

Слабая вероятностная аксиоматика основана на одной единственной аксиоме: рассматривается конечная выборка неслучайных объектов, которые появляются в случайном порядке, причём все перестановки равновероятны. Событие — это бинарная функция на множестве всех перестановок выборки. Вероятность события определяется как доля перестановок выборки, при которых эта бинарная функция принимает единичное значение (т.е. событие имеет место).

В слабой аксиоматике удаётся переформулировать значительную часть фундаментальных результатов теории вероятностей и математической статистики, оносящихся к конечным выборкам независимых наблюдений. В их числе: закон больших чисел, закон сходимости эмпирических распределений (критерий Смирнова), многие непараметрические, ранговые и перестановочные статические критерии, теория обобщающей способности, теория информации. Во многих случаях получаемые оценки являются точными, т.е. не асимптотическими и не завышенными. Многие результаты сильно упрощаются, освобождаясь от второстепенных технических усложнений, связанных с теорией меры. Например, отпадает необходимость введения различных типов сходимости.

Основные направления исследований:

  • выяснение границ применимости слабой вероятностной аксиоматики;
  • точные (комбинаторные) статистические тесты;
  • эффективные алгоритмы вычисления комбинаторных оценок;
  • исследование других вероятностных предположений, кроме равновероятности всех перестановок;
  • множественное тестирование статистических гипотез и его связь с проблемой переобучения.

Ключевые слова: exchangeability, permutational statistics, concentration of probability measure.

Другие проекты и семинары

(в значительной степени устаревшие)

Виртуальные семинары

Материалы для преподавателей

Семинары

Публикации

Основное

Всё остальное

Софт и проекты

  • ChartLib — Библиотека деловой и научной графики (1998-2008)

Удобный инструмент для аналитических исследований, генерации графиков в Internet, подготовки отчетов, выполнения курсовых и дипломных работ, встраивания графиков в приложения на Delphi и C#. Имеет собственный формат входных данных CHD (CHart Description), позволяющий описывать как таблицы данных, так и внешний вид графика. Поддерживается более 150 команд, более 50 свойств точек графика, имеется встроенный калькулятор арифметических выражений. Графики могут быть выведены в окно прикладной программы, на принтер, в буфер обмена, в файлы графических форматов BMP, EMF, PNG, JPEG, GIF. Имеется программа chdView.exe для просмотра CHD-файлов.

Страница: ChartLib
Документация: на сайте ВЦ РАН (надо вручную переключиться на KOI8-R)
  • BigARTM — Открытая библиотека тематического моделирования (текущий проект)

Параллельная распределённая реализация методов вероятностного тематического моделирования на основе аддитивной регуляризации. Реализация ядра библиотеки на С++, интерфейсы на C++, Python. Позволяет добавлять новые регуляризаторы и метрики качества.

Страница: github.com/bigartm
Документация: bigartm.org
Архитектор проекта Александр Фрей
  • TopicNet — Открытая библиотека тематического моделирования под Python (текущий проект)

Верхнеуровневая обёртка над BigARTM, упрощающая построение тематических моделей в прикладных проектах и автоматизирующая проведение вычислительных экспериментов по оптимизации моделей.

Страница: github.com/machine-intelligence-laboratory/TopicNet
Разработка лаборатории машинного интеллекта МФТИ
  • SciSearch.ai — пилотный проект «Мастерской знаний» (текущий проект)

Поисково-рекомендательная система для формирования и анализа тематических подборок англоязычных научных статей.

Аспиранты и студенты

Аспиранты МФТИ МГУ
  • Шаура Ишкина
  • Юлиан Сердюк
  • Василий Алексеев
  • Николай Герасименко
  • Кирилл Хрыльченко

  • Дарья Соболева
  • Николай Скачков
  • Алексей Ватолин

  • Светлана Крыжановская
  • Алексей Гришанов

  • Глеб Скиба
  • Алексей Кузнецов

  • Евгений Косарев
  • Жанасыл Абдуллаева
  • Лидия Виткова

  • Александр Соколов
  • Константин Нагаев

  • Фёдор Соболевский
  • Мария Дзюба
  • Михаил Пукемо

  • Дмитрий Мелихов

  • Илья Дьяков
  • Анна Карпинская
  • Александр Левыкин
  • Данила Ильин

  • Роман Голубев
  • Илья Цыбанов
  • Александр Багров

Бакалаврские диссертации

  1. Дмитрий Иванцов. Новые методы технического анализа фьючерсных рынков. 2003. МФТИ.
  2. Рустем Таханов. Некоторые комбинаторные оценки качества обучения по прецедентам. 2004. МФТИ.
  3. Дмитрий Житлухин. О некоторых алгоритмах синтеза неэквивалентных матриц Адамара. 2005. МФТИ.
  4. Андрей Ивахненко. Исследование обобщающей способности логических алгоритмов классификации. 2005. МФТИ.
  5. Василий Лексин. Методы выявления взаимосогласованных структур сходства в системах взаимодействующих объектов. 2005. МФТИ.
  6. Фёдор Ульянов. Связь информативности и обобщающей способности в метрических алгоритмах классификации. 2005. МФТИ.
  7. Сергей Ументаев. Алгоритмы динамического обучения принятию решений в сильно зашумлённых временных рядах. 2005. МФТИ.
  8. Иван Гуз. Алгоритмические композиции с монотонными и выпуклыми корректирующими операциями. 2006. МФТИ.
  9. Александр Маценов. Методы обучения линейных композиций алгоритмов классификации. 2006. МФТИ.
  10. Никита Пустовойтов. Обучение композиций дипольных классификаторов на основе ЕМ-алгоритма. 2007. МФТИ.
  11. Александр Климов. Методы предсказания рейтингов в рекомендующих системах. 2007. МФТИ.
  12. Александр Орлов. Проблема переобучения при отборе признаков в линейной регрессии с фиксированными коэффициентами. 2007. МФТИ.
  13. Артур Коваль. Прогнозирование временных рядов с несимметричным функционалом потерь. 2007. МФТИ.
  14. Александр Ширяев. Выбор опорных множеств в алгоритмах типа вычисления оценок: нейросетевой подход. 2007. ВМК МГУ.
  15. Ирина Лебедева. Об одном методе статистически обоснованного сравнения временных рядов доходности паевых инвестиционных фондов. 2008. МФТИ.
  16. Александр Фрей. О дискретных аппроксимациях непрерывных вероятностных распределений. 2008. МФТИ.
  17. Кирилл Чувилин. Проблема переобучения при отборе признаков по внешним критериям в многомерной линейной регрессии. 2008. МФТИ.
  18. Пётр Цюрмасто. Влияние различности алгоритмов на обобщающую способность метода минимизации эмпирического риска. 2008. МФТИ.
  19. Андрей Бадзян. Комбинаторный аналог неравенства МакДиармида и обобщающая способность стабильных алгоритмов. 2008. МФТИ.
  20. Анастасия Зухба. Метрические алгоритмы классификации с отбором опорных объектов. 2009. МФТИ.
  21. Павел Минаев. Расширенная методика тестирования алгоритмов классификации. 2009. МФТИ.
  22. Алексей Романенко. Адаптивный выбор оптимальной модели временного ряда на основе множества статистических критериев. 2009. МФТИ.
  23. Алексей Куренной. Распознавание цитат в текстовых фрагментах. 2009. ВМК МГУ.
  24. Никита Спирин. Монотонные композиции алгоритмов ранжирования. 2010. МФТИ.
  25. Юрий Янович. Оценивание скрытого профиля компактности в задачах обучения методом ближайшего соседа. 2010. МФТИ.
  26. Алексей Островский. Эмпирическое исследование линейных и монотонных композиций алгоритмов ранжирования. 2010. МФТИ.
  27. Игорь Литвинов. Адаптивные методы квантильной регрессии для прогнозирования временных рядов. 2010. МФТИ.
  28. Евгений Зайцев. Прогнозирование средних скоростей движения в городской автотранспортной сети. 2011. МФТИ.
  29. Никита Животовский. Вероятность большого отклонения частоты ошибок на тестовой выборке от оценки скользящего контроля. 2011. МФТИ.
  30. Александр Мафусалов. Комбинаторные оценки вероятности переобучения пороговых классификаторов. 2011. МФТИ.
  31. Александр Фирстенко. Методы выделения терминов и тематической классификации текстовых документов. 2011. МФТИ.
  32. Михаил Кокшаров. Комбинаторные оценки обобщающей способности на основе попарного сравнения алгоритмов. 2012. МФТИ.
  33. Михаил Бурмистров. Методы оптимизации параметров вероятностных тематических моделей. 2012. МФТИ.
  34. Александр Романенко. Категоризация текстов на основе монотонного классификатора ближайшего соседа. 2012. МФТИ.
  35. Илья Ямщиков. Методы обучаемого ранжирования для поиска релевантных алгоритмов классификации. 2012. МФТИ.
  36. Ильдар Газизов. Проект информационно-аналитической системы для поддержки консультирования по функционально-ролевой модели бизнеса. 2012. МФТИ.
  37. Степан Лобастов. Построение тематической классификации коллекции документов с неизвестным числом тем, презентация. 2013. МФТИ.
  38. Влада Целых. Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов, презентация. 2013. МФТИ.
  39. Светлана Цыганова. Выявление несогласованностей в иерархической тематической модели с фиксированной иерархией. 2013. МФТИ.
  40. Александр Бырдин. Классификация текстовых объявлений. 2014. МФТИ.
  41. Сергей Воронов. Фильтрация и тематическое моделирование коллекции научных документов. 2014. МФТИ.
  42. Олег Гринчук. Классификация нестационарного потока текстовых объявлений, презентация. 2014. МФТИ.
  43. Кирилл Неклюдов. Обнаружение аномалий в дискретных временных рядах, презентация. 2014. МФТИ.
  44. Мария Рыскина. Регуляризация вероятностных тематических моделей для повышения устойчивости и интерпретируемости. 2014. МФТИ.
  45. Даниил Яшков. Методы понижения размерности в задаче поиска аномалий в многомерных временных рядах, презентация. 2014. МФТИ.
  46. Андрей Шапулин. Регуляризация вероятностных тематических моделей для классификации символьных последовательностей. 2015. ВМК МГУ.
  47. Михаил Хальман. Методы персонализации показа объявлений в рекламной сети. 2015. ВМК МГУ.
  48. Никита Дойков. Адаптивная регуляризация вероятностных тематических моделей. 2015. ВМК МГУ.
  49. Мурат Апишев. Мультимодальные регуляризованные вероятностные тематические модели. 2015. ВМК МГУ.
  50. Александра Кузнецова. Методы регуляризации для отбора признаков в линейных классификаторах и их применение в банковской клиентской аналитике. 2015. ВШЭ.
  51. Алексей Гринчук. Использование контекстной документной кластеризации для улучшения качества тематических моделей. 2015. МФТИ.
  52. Ирина Ефимова. Формирование однородных обучающих выборок в задачах классификации. 2015. МФТИ.
  53. Андрей Игнатов. Deep Learning in information analysis of electrocardiogram signals for disease diagnostics. 2015. МФТИ.
  54. Анна Липатова. Выделение мультиграммных признаков в задачах классификации символьных последовательностей. 2015. МФТИ.
  55. Анастасия Макарова. Выделение информативных признаков заболеваний в информационном анализе электрокардиосигналов. 2015. МФТИ.
  56. Александр Плавин. Отбор тем в задачах тематического моделирования. 2015. МФТИ.
  57. Михаил Швец. Монотонные классификаторы для задач медицинской диагностики. 2015. МФТИ.
  58. Михаил Шинкевич. Применение коллаборативной фильтрации, активного обучения и навигационной корреляции в задаче выделения селекторов. 2015. МФТИ.
  59. Надежда Чиркова. Иерархические тематические модели для интерактивной навигации по коллекциям текстовых документов. 2016. ВМК МГУ.
  60. Никита Шаповалов. Тематические модели для классификации символьных последовательностей в задачах биоинформатики и анализа биомедицинских сигналов. 2016. ВМК МГУ.
  61. Юлия Молчанова. Проверка адекватности тематических моделей в онлайновых алгоритмах. 2016. ВМК МГУ.
  62. Иван Ивашковский. Методы инициализации в вероятностном тематическом моделировании. 2016. ФИВТ МФТИ.
  63. Анастасия Янина. Мультимодальные тематические модели статей коллективных блогов для разведочного поиска. 2016. ФИВТ МФТИ.
  64. Илья Жариков. Статистические тесты однородности символьных последовательностей. 2016. ФУПМ МФТИ.
  65. Евгений Смирнов. Суммаризация тем в вероятностном тематическом моделировании. 2016. ФУПМ МФТИ.
  66. Светлана Шишковец. Аддитивная регуляризация наивного линейного байесовского классификатора. 2016. ФУПМ МФТИ.
  67. Роза Айсина. Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным. 2017. ВМК МГУ.
  68. Артём Попов. Регуляризация тематических моделей для векторных представлений слов. 2017. ВМК МГУ.
  69. Владимир Полушин. Тематические модели для ранжирования рекомендаций текстового контента. 2017. ВМК МГУ.
  70. Владислав Батаев. Тематическая сегментация разговоров контактного центра. 2017. ФИВТ МФТИ.
  71. Карен Манукян. Интеллектуальная диалоговая система для автоматизации деятельности контакт-центра. 2017. ФИВТ МФТИ.
  72. Александр Софиенко. Классификация положительных и неразмеченных текстовых документов. 2017. ФИВТ МФТИ.
  73. Дмитрий Федоряка. Технология интерактивной визуализации тематических моделей. 2017. ФУПМ МФТИ.
  74. Ольга Цветкова. Анализ банковских транзакционных данных для выявления паттернов экономического поведения клиентов. 2017. ФУПМ МФТИ.
  75. Виталий Малыгин. Формирование репрезентативных обучающих выборок. 2017. ФУПМ МФТИ.
  76. Дарья Соболева. Языковое моделирование в задаче построения вопрос-ответной системы. 2018. ВМК МГУ.
  77. Николай Кругликов. Тематическое моделирование текстовых коллекций в диалоговых системах. 2018. ВМК МГУ.
  78. Анастасия Фадеева. Темпоральное моделирование новостных потоков. 2018. ФКН НИУ ВШЭ.
  79. Мария Селезнёва. Построение и оценка качества гетерогенных иерархических тематических моделей. 2018. ФУПМ МФТИ.
  80. Василий Алексеев. Внутритекстовая когерентность как мера интерпретируемости тематических моделей текстовых коллекций. 2018. ФУПМ МФТИ.
  81. Антон Захаренков. Итеративный подбор коэффициентов регуляризации тематических моделей. 2018. ФУПМ МФТИ.
  82. Даниил Фельдман. Использование фактов для поиска мнений в новостях. 2018. ФУПМ МФТИ.
  83. Филипп Никитин. Применение мультимодальных тематических моделей к анализу транзакционных данных. 2018. ФУПМ МФТИ.
  84. Анастасия Павловская. Тематическое моделирование в задаче классификации отзывов покупателей о работе и ассортименте продуктового магазина. 2018. ФУПМ МФТИ.
  85. Николай Скачков. Тематико-стилистические векторные представления текстовых пользовательских запросов. 2019. ВМК МГУ.
  86. Михаил Солоткий. Вероятностные тематические модели на основе данных о со-встречаемости слов. 2019. ВМК МГУ.
  87. Галина Фоминская. Проблема несбалансированности тем в вероятностных тематических моделях. 2019. ВМК МГУ.
  88. Николай Шаталов. Методы обучения без учителя для автоматического выделения составных терминов в текстовых коллекциях. 2019. ВМК МГУ.
  89. Вадим Захаренко. Методы обнаружения новых тем в вероятностных тематических моделях. 2019. ВМК МГУ.
  90. Анастасия Кряжова. Методы оценивания семантической близости фраз для классификации текстовых сообщений. 2019. НИУ ВШЭ.
  91. Анна Рогозина. Проверка гипотезы условной независимости для оценивания качества тематической кластеризации. 2019. ФПМИ МФТИ.
  92. Евгений Козлинский. Сегментация транзакционных данных розничных клиентов банка. 2019. ФПМИ МФТИ.
  93. Вадим Кислинский. Построение мультимодальной рекомендательной системы. 2019. ФПМИ МФТИ.
  94. Павел Плюснин. Итерационные методы балансировки тем в тематическом моделировании. 2019. ФПМИ МФТИ.
  95. Максим Еремеев. Ранжирование текстовых документов на основе оценок когнитивной сложности текстов. 2020. ВМК МГУ.
  96. Алексей Гришанов. Построение рекомендательной системы, основанной на обучении с подкреплением. 2020. ФПМИ МФТИ.
  97. Вадим Новоселов. Темпоральные тематические модели новостных потоков с возможностью обнаружения новых тем и событий. 2021. ВМК МГУ.
  98. Виктор Панкратов. [[Media:Pankratov21bsc.pdf|Вероятностное тематическое моделирование
Личные инструменты