Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
Руководитель спецсеминара: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Направления работы на спецсеминаре
|   | См. также «Правила для постоянных участников». | 
|   | Информация для второкурсников! | 
 
  | 
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Здесь же возникают задачи современной теории интерполяции: построения функций специального вида, заданных частично. Можно заниматься дискретным направлением: решать подобные задачи для функций, принимающих значения 0 и 1. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
 - Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, построение рекомендательных систем, прогнозирование свойств динамических графов (в том числе и графов социальных сетей), прогнозирование поведения потребителей, анализ метаданных, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 
Заседания спецсеминара
|   | В осеннем семестре заседания будут проходить по четвергам в ауд. 637, начало в 18:00. Вход свободный. Начало - 29 сентября. | 
Заседания 2016—2017 уч. года
| Дата | Докладчик | Доклад | Материалы | |
|---|---|---|---|---|
| 29 сентября 2016 | Слипенчук Павел Владимирович, аспирант каф. ИУ-8 (Информационная безопасность) МГТУ им.Баумана; ведущий инжерен Департамента Безопасности Сбербанка, специалист по разработке систем фрод-мониторинга |  "Информационная стеганография"
 "Стеганография -- это междисциплинарная наука и искусство сокрытия информации внутри другой информации. В эпоху активного развития вычислительной техники и BigData задачи стеганографии и противодействия стеганографии (стегоанализа) становяться все более и более актуальными. Отдельный интерес представляет собой синтез стеганографии и машинного обучения. В докладе будет объяснена актуальность стеганографии в XXI веке, будут приведены информационно-теоретческие модели стеганографических каналов передачи данных и высказан ряд авторских идей о синтезе стеганорафии и машинного обучения."  | слайды (pdf) | |
| 6 октября 2016 | Никишин Евгений, студент 4-го курса | Asymmetric LSH for Sublinear Time Maximum Inner Product Search | слайды (pdf), статья | |
| Остапец Андрей, аспирант 3 г.о. | ACM RecSys Challenge 2016 | соревнование | ||
| 13 октября 2016 | Севастопольский Артем, 4-й курс | Глубокие нейронные сети для сегментации изображений. Программирование нейронных сетей. | слайды (pdf) ipython notebook (Keras) статья 1 (FCN) статья 2 (U-Net) | |
| 20 октября 2016 | Иванов Сергей, 3-й курс | Проверка гипотезы Birthday Effect | слайды (slideshare) | |
| Кудрявцев Георгий, студент 5 курса | Чат боты | |||
| 27 октября 2016 | Нижибицкий Евгений, аспирант 3 г.о. | Классификация текстов и категоризация объявлений с помощью нейронных сетей (конкурс Avito) | ||
| Каюмов Эмиль, 4-й курс | Обзор рекуррентных нейронных сетей и статьи Visualizing and Understanding Recurrent Networks | arxiv слайды (pdf) блог | ||
| 3 ноября 2016 | Трофимов Михаил, аспирант 1 г.о. | Квантовое машинное обучение | ||
| Гурьянов Алексей, 6-й курс | Обучение с подкреплением | |||
| 10 ноября 2016 | Гетоева Аида, 5-й курс. | Определение припадка у людей с эпилепсией по ЭЭГ | ||
| t.b.a. | Рысьмятова Анастасия, 5-й курс | Sequence Graph Transform (SGT): A Feature Extraction Function for Sequence Data Mining | arxiv | |
| t.b.a. | Кибитова Валерия, 6-й курс | Резюмирование текстовой информации. | 
Заседния в предыдущих семестрах:
- Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2015-2016 уч. года.
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2014-2015 уч. года.
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2013-2014 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2012-2013 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (весенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2011-2012 уч. года (осенний семестр).
 - Алгебра над алгоритмами и эвристический поиск закономерностей/Заседания 2010-2011 уч. года (весенний семестр).
 
Текущие задания участников спецсеминара
|   |  Список источников для потенциальных докладов.
 Доклады по статьям Доклады по авторам 
  | 
| Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий | 
|---|---|---|
| Нижибицкий Евгений (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Остапец Андрей (А3) | Подготовка плана-проспекта диссертации, статьи в журнале из списка ВАК (подача до декабря). | |
| Кудрявцев Георгий (517) | Выбор темы курсовой работы | |
| Рысьмятова Анастасия (517) | Выбор темы для курсовой работы | |
| Вихрева Мария (517) | Выбор темы для курсовой работы | |
| Каюмов Эмиль (417) | Выявление ишемической болезни сердца по сигналам кардиограмм. | |
| Никишин Евгений (417) | Выбор темы для ВКР | |
| Севастопольский Артём (417) | ВКР "Методы распознавания глаукомы на основе нейронных сетей" | |
| Иванов Сергей (317) | Прогнозирование гибели супружеских пар функций | |
| Трофимов Михаил (МФТИ) | Подготовка плана-проспекта диссертации | |
| Гущин Александр (МФТИ) | Выбор темы для ВКР | |
| Кибитова Валерия (617) | ||
| Гурьянов Алексей (617) | ВКР "Стратегии исследования окружений в обучении с подкреплением с непрерывным пространством состояний." | 
Участники спецсеминара
| Год выпуска | Участники | 
|---|---|
| 2017 бак | 
 Никишин Евгений 
 Каюмов Эмиль 
 Севастопольский Артём 
  | 
| 2018 маг | 
 Кудрявцев Георгий 
 Рысьмятова Анастасия 
 Вихрева Мария 
  | 
| 2017 маг | 
 Кибитова Валерия 
  | 
| аспиранты 1 г.о. | 
 Трофимов Михаил 
 
  | 
| аспиранты 3 г.о. | 
 
  | 
Выпускники спецсеминара
| Год выпуска | Выпускники | 
|---|---|
| Аспирант, 2010 | 
 Карпович Павел 
 Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09).  | 
| 2015 бак | 
 Славнов Константин 
  | 
| 2015 | 
 Харациди Олег 
  | 
| 2014 | 
 
 
 
  | 
| 2013 | 
 Бобрик Ксения 
 Ермушева Александра 
 Кириллов Александр 
 Кондрашкин Дмитрий (перевёлся на другой спецсеминар) 
 
 
  | 
| 2012 | 
  | 
| 2010 | 
 Ахламченкова Ольга 
 Токарева (Одинокова) Евгения 
  | 
| 2009 | 
 Власова Юлия 
 Логинов Вячеслав 
 Фёдорова Валентина 
 Чучвара Алексндра (бакалавр) 
  | 
| 2008 | 
 Ломова Дарья 
 Вершкова Ирина 
  | 
| 2007 | 
 Кнорре Анна 
 Карпович Павел 
 Сиваченко Евгений 
  | 
| 2006 | 
 Ховратович (Курятникова) Татьяна 
 Мошин Николай 
  | 
| 2005 | 
 Каменева Наталия 
 Силкин Леонид 
  | 
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
 - Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
 - Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
 - Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
 - Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
 - Прогноз связности графа социальной сети Предсказать изменения динамического графа социальной сети, в частности, появление новых рёбер.
 - Прогнозирование успешности грантов и проектов По описанию заявки оценить перспективность выполнения данного проекта.
 - Разработка рекомендательного алгоритма, который делает актуальные предложения купить какой-то товар, воспользоваться услугой или прочитать материал.
 - Предсказывание визитов покупателей и сумм покупок для сети супермаркетов Разработка алгоритма, который предсказывает дату первого визита и сумму покупки каждого клиента.
 - Оценка фотографий по метаданным Прогноз «интересности» фото-материалов на основе анализа названия, описания, GPS-координат съёмки и т.п.
 - Задача кредитного скоринга Прогнозирование надёжности клиента банка по обязательствам выплаты процентов кредита.
 

