Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
(Различия между версиями)
												
			
			 (→Задание участникам на осенний семестр 2011 года)  | 
				 (→Задание участникам на осенний семестр 2011 года)  | 
			||
| Строка 40: | Строка 40: | ||
|-  | |-  | ||
| '''Остапец Андрей''' (317)  | | '''Остапец Андрей''' (317)  | ||
| - | | Тема доклада «'''Фракталы, аттракторы, нейронные сети   | + | | Тема доклада «'''Фракталы, аттракторы, нейронные сети'''» по лекции http://www.niisi.ru/iont/ni/Library/School-2002/Makarenko-2002.pdf  | 
|  | |  | ||
|-  | |-  | ||
Версия 21:21, 3 сентября 2011
Руководитель спецсеминара: д.ф.-м.н. Дьяконов Александр Геннадьевич
 
  | 
Работа на спецсеминаре
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Доказано (Ю. И. Журавлёвым), что среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
 - Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
 
Задание участникам на осенний семестр 2011 года
| Участник | Задание (каждый сам заполняет свою ячейку) | комментарий | 
|---|---|---|
| Бобрик Ксения (417) | Выбрать на сайте http://www.sigkdd.org/awards_dissertation.php тему доклада по одной из диссертаций. Темы не должны пересекаться. Можно использовать другие диссертации по согласованию с руководителем. | |
| Ермушева Александра (417) | Выбрать на сайте http://www.sigkdd.org/awards_dissertation.php тему доклада по одной из диссертаций. Темы не должны пересекаться. Можно использовать другие диссертации по согласованию с руководителем. | |
| Кириллов Александр (417) | Выбрать на сайте http://www.sigkdd.org/awards_dissertation.php тему доклада по одной из диссертаций. Темы не должны пересекаться. Можно использовать другие диссертации по согласованию с руководителем. | |
| Фигурнов Михаил (417) | Выбрать на сайте http://www.sigkdd.org/awards_dissertation.php тему доклада по одной из диссертаций. Темы не должны пересекаться. Можно использовать другие диссертации по согласованию с руководителем. | пока неофициальный участник | 
| Кондрашкин Дмитрий (317) | Выбрать на сайте http://www.niisi.ru/iont/ni/Library/ тему доклада по одной из лекций Н.Г. Макаренко. Темы не должны пересекаться. Можно использовать другие лекции по согласованию с руководителем. | |
| Нижибицкий Евгений (317) | Выбрать на сайте http://www.niisi.ru/iont/ni/Library/ тему доклада по одной из лекций Н.Г. Макаренко. Темы не должны пересекаться. Можно использовать другие лекции по согласованию с руководителем. | |
| Остапец Андрей (317) | Тема доклада «Фракталы, аттракторы, нейронные сети» по лекции http://www.niisi.ru/iont/ni/Library/School-2002/Makarenko-2002.pdf | |
| Фонарёв Александр (317) | Тема доклада «Эмбедология и нейропрогноз» по лекции http://www.niisi.ru/iont/ni/Library/School-2003/Makarenko-2003.pdf | 
Доклады 2011(весна) года
| Дата | Докладчик | Название доклада | 
|---|---|---|
| 13.04.2011 | Кириллов Александр | Предсказание связности графов | 
| 20.04.2011 | Ермушева Александра | Задачи и методы коллаборативной фильтрации | 
| 04.05.2011 | Платонова Елена | Задачи и методы информационного поиска | 
| 11.05.2011 | Бобрик Ксения | Прогнозирование временных рядов | 
Участники спецсеминара
| Год выпуска | Участники: | 
|---|---|
| Аспирант, 2010 | 
 Карпович Павел 
 Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09)  | 
| 2013 | 
 Бобрик Ксения 
 Ермушева Александра 
 Кириллов Александр 
 
  | 
| 2012 | 
  | 
| Выпускники: | |
| 2010 | 
 Ахламченкова Ольга 
 Токарева (Одинокова) Евгения 
  | 
| 2009 | 
 Власова Юлия 
 Логинов Вячеслав 
 Фёдорова Валентина 
 Чучвара Алексндра (бакалавр) 
  | 
| 2008 | 
 Ломова Дарья 
 Вершкова Ирина 
  | 
| 2007 | 
 Кнорре Анна 
 Карпович Павел 
 Сиваченко Евгений 
  | 
| 2006 | 
 Ховратович (Курятникова) Татьяна 
 Мошин Николай 
  | 
| 2005 | 
 Каменева Наталия 
 Силкин Леонид 
  | 
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
 - Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
 - Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
 - Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
 - Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.
 

