Участник:Vokov

Материал из MachineLearning.

(Различия между версиями)

Версия 19:16, 23 апреля 2008

Содержание

1 Учебные курсы
2 Научные интересы
3 Публикации
4 Софт
5 Внешние ссылки
6 Ссылки внутри MachineLearning.RU
7 Планы по развитию MachineLearning.RU
8 Мои подразделы

Воронцов Константин Вячеславович

к.ф.-м.н.
Зам. директора по науке ЗАО Форексис.
Научный сотрудник Вычислительного центра РАН.
Зам. зав. каф. «Интеллектуальные системы» МФТИ.
Доц. каф. «Математические методы прогнозирования» ВМиК МГУ.

Один из идеологов ресурса MachineLearning.RU, Администратор.

Учебные курсы

Научные интересы

Всё, что скрывается за терминами «интеллектуальный анализ данных» (data mining) и «машинное обучение» (machine learning): распознавание образов, прогнозирование, математическая статистика, дискретная математика, численные методы оптимизации. Практический анализ данных в разнообразных областях (экономика, медицина, техника, интернет).

Теория обобщающей способности

Проблема обобщающей способности является ключевой и в то же время наиболее сложной в машинном обучении. Если алгоритм обучен по конечной выборке прецедентов, то как предсказать качество его работы на новых прецедентах? Почему это вообще возможно? Как надо обучать алгоритм, чтобы он редко ошибался на новых данных?

Активное исследование этих вопросов началось в конце 60-х, когда В.Н.Вапник и А.Я.Червоненкис предложили статистическую теорию восстановления зависимостей по эмпирическим данным. Они получили верхние оценки вероятности ошибок обученного алгоритма, позволившие обосновать давно замеченный эмпирический факт: по мере увеличения сложности используемого семейства алгоритмов качество обучения сначала улучшается, затем начинает ухудшаться. Ухудшение связано с эффектом переобучения: чрезмерно сложные алгоритмы имеют избыточное число свободных параметров; при обучении этих параметров по выборке алгоритм настраивается не только на восстановление зависимости, но и на воспроизведение разного рода погрешностей. Погрешности в реальных задачах всегда присутствуют: во-первых, это ошибки измерения (шум), во-вторых, что гораздо существеннее, это невязка между используемой моделью и неизвестной истинной зависимостью. В теории Вапника-Червоненкиса разработан метод структурной минимизации риска (СМР), позволяющий автоматически находить модель оптимальной сложности.

К сожалению, статистические оценки чрезвычайно сильно завышены. В методе СМР это часто влечет переупрощение модели. Несмотря на 40-летние усилия многих ученых, точные оценки качества обучения до сих пор не получены.

Основные направления исследований:

комбинаторная теория обобщающей способности;
уточнение оценок обобщающей способности для различных частных случаев;
разработка новых алгоритмов обучения на их основе.

Ключевые слова: generalization ability, computational learning theory, Vapnik-Chervonenkis theory.

Комбинаторная статистика

Это направление логично вытекает из предыдущего и является его обобщением. Оказывается, многие фундаментальные факты теории вероятностей и математической статистики можно переформулировать и доказать, не опираясь на колмогоровскую аксиоматику, то есть не используя теорию меры, и даже не употребляя само понятие вероятности. В задачах анализа данных мы всегда имеем дело с выборками конечной длины. Поэтому естественно ставить вопрос не «какова вероятность события?», а «какой может быть частота этого события на скрытых (пока еще не известных) данных?». Ответы на эти два вопроса, вообще говоря, различны, причем на выборках малой длины различие существенно. Вероятность события — абстрактная идеализированная величина. Частота события — это как раз то, что реально измеряется в эксперименте. Именно ее и имеет смысл предсказывать.

Слабая вероятностная аксиоматика основана на одной единственной аксиоме: рассматривается конечная выборка неслучайных объектов, которые появляются в случайном порядке. Вероятность события определяется как доля перестановок выборки, при которых выполняется заданное условие.

В слабой аксиоматике удаётся переформулировать закон больших чисел, закон сходимости эмпирических распределений (критерий Смирнова), многие статические критерии, в первую очередь, ранговые критерии, теорию обобщающей способности, теорию информации. Во многих случаях получаемые оценки являются точными, т.е. не асимптотическими и не завышенными. Однако для их вычисления может потребоваться разработка специальных эффективных алгоритмов.

Основные направления исследований:

выяснение границ применимости слабой вероятностной аксиоматики;
точные (комбинаторные) статистические критерии;
эффективные алгоритмы вычисления комбинаторных оценок.

Алгоритмические композиции

Алгоритмические композиции применяются в сложных задачах, когда имеющиеся базовые алгоритмы не дают желаемого качества обучения. В таких случаях строят композиции алгоритмов, стараясь, чтобы ошибки различных алгоритмов скомпенсировали друг друга.

Самый простой пример композиции — усреднение ответов, выдаваемых базовыми алгоритмами. Можно усреднять с весами. Можно выделять области компетентности различных алгоритмов, и в каждой области использовать свое распределение весов. Можно строить композиции алгоритмов с помощью нелинейных операций. Какой из этих методов лучше? В каких задачах? Как обучать базовые алгоритмы, учитывая, что они будут работать не по-отдельности, а в составе композиции? Можно ли приспособить для этого стандартные методы обучения? Как оценивать и целенаправленно улучшать обобщающую способность композиции? Как при этом сделать число алгоритмов в композиции поменьше?

Идея алгоритмических композиций была выдвинута в середине 70-х годов в работах академика РАН Ю.И.Журавлева. В зарубежных исследованиях это тема стала чрезвычайно популярной в 90-е годы, после изобретения алгоритмов бустинга, смесей экспертов и других композитных конструкций.

Основные направления исследований:

разработка эффективных алгоритмов построения композиций;
повышение обобщающей способности композиций;
сравнительный анализ различных методов построения композиций.

Ключевые слова: multiple classifier systems, ensemble learning, classifier fusion, mixture of experts.

Анализ клиентских сред

Анализ клиентских сред (АКС) является относительно новой и быстро развивающейся областью интеллектуального анализа данных (data mining). В современном бизнесе чрезвычайно востребовано решение следующей задачи, точнее даже группы задач.

Имеется некоторый набор ресурсов (товаров, услуг, предметов) которыми пользуется огромное количество клиентов. Все действия пользователей протоколируются в электронном виде. Эти данные содержат ценнейшую информацию, необходимую для повышения качества оказываемых услуг, однако извлечь ее не так просто ввиду огромного объема данных. Какие ресурсы наиболее популярны, и среди каких групп клиентов? Возможно ли угадать интересы клиента и сформировать для него персональное предложение, от которого он с высокой вероятностью не откажется? Как выявить клиентов, собирающихся в ближайшее время отказаться от обслуживания? Эти и другие задачи решаются в системах управления взаимоотношениями с клиентами (client relationship management, CRM). Создание математического обеспечения для них является актуальной и наукоемкой задачей.

Один из типичных примеров клиентской среды — интернет-портал, предоставляющий доступ к большому количеству ресурсов, скажем, интернет-магазин или поисковый сервер. Технология АКС позволяет решать задачи персонализации контента — когда результаты поиска, информационные каталоги, предложения товаров и услуг, и т.д. выстраиваются в таком порядке, чтобы пользователю легче было находить информацию, необходимую именно ему, именно в данный момент.

Основные направления исследований:

разработка эффективных алгоритмов АКС;
решение задач персонализации контента;
и других прикладных задач.

Ключевые слова: client relationship management, web mining, web usage mining, collaborative filtering.

Публикации

Список публикаций

Софт

ChartLib — ChartLib(документация)

Библиотека деловой и научной графики. Удобный инструмент для аналитических исследований, генерации графиков в Internet, подготовки отчетов, выполнения курсовых и дипломных работ, встраивания графиков в приложения на Delphi и C#. Имеет собственный формат входных данных CHD (CHart Description), позволяющий описывать как таблицы данных, так и внешний вид графика. Поддерживается более 150 команд, более 50 свойств точек графика, имеется встроенный калькулятор арифметических выражений. Графики могут быть выведены в окно прикладной программы, на принтер, в буфер обмена, в файлы графических форматов BMP, EMF, PNG, JPEG, GIF. Имеется программа chdView.exe для просмотра CHD-файлов.

Внешние ссылки

Ссылки внутри MachineLearning.RU

Служебные страницы

MachineLearning:Концепция ресурса
MachineLearning:Инструктаж
MachineLearning:ЧаВО — пора улучшить, многое отсюда давно уже перенесено в MachineLearning:Инструктаж
MachineLearning:Портал сообщества — здесь надо бы что-то написать
MachineLearning:Вниманию участников
MachineLearning:Справка — сделать коллекцию ссылок на все справочные материалы как внутри, так и вне
MachineLearning:Публикации и библиографии и Обсуждение
MediaWiki:Edittools

Шаблоны

Планы по развитию MachineLearning.RU

Сильно недописанные статьи

Немного недописанные статьи

Базовые понятия

Теория вычислительного обучения

Классификация, распознавание образов

Классификация на основе сходства

Категория:Метрические алгоритмы классификации (классификация на основе сходства, similarity-based classification)
Гипотеза компактности
Матрица расстояний
Метрика = Функция расстояния = Сходство
Метод ближайшего соседа = kNN
Метод потенциальных функций
Метод радиальных базисных функций = Сеть радиальных базисных функций = RBF
Метод парзеновского окна
Проклятие размерности
CBR = Case based reasoning = Рассуждение по прецедентам (?)

Классификация на основе разделимости

Байесовский вывод

Нейронные сети

Дискретные (логические) алгоритмы классификации

Кластерный анализ

Корреляционный и регрессионный анализ

Прогнозирование

Сокращение размерности

Алгоритмические композиции

Предварительный анализ данных

Projection pursuit

Интеллектуальный анализ данных

Теории, научные школы

Прикладные задачи интеллектуального анализа данных

Мои подразделы

Vokov/CV	Vokov/Publications	Vokov/Вики-ресурс MachineLearning.RU: концепция и перспективы
Vokov/Иллюзия простоты выбора	Vokov/Интервью для InTalent.pro	Vokov/Интервью для Кота Шрёдингера 2017-10-04
Vokov/Интервью для Новой газеты 2019-02-25	Vokov/Интервью для ПостНауки 2017-09-27	Vokov/Интервью для РИА Новости 2020-05-25
Vokov/Комбинаторная статистика	Vokov/Научпоп	Vokov/Некоторые задачи интеллектуального анализа данных (лекция)
Vokov/Песочница	Vokov/Планы по развитию MachineLearning.RU	Vokov/Публикации

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Vokov»

Категория: Страницы участников

@@ Строка 176: / Строка 176: @@
 *[[Максимум правдоподобия]]
-=== Теория статистического обучения ===
+=== Теория вычислительного обучения ===
-*[[Теория статистического обучения]]
+*[[:Категория:Теория вычислительного обучения]]
-*[[Теория вычислительного обучения]] = [[COLT]]
+*[[Теория статистического обучения]] = [[Теория вычислительного обучения]] = [[COLT]]
 *[[Контрольная выборка]]
 *[[Тестовая выборка]]
 *[[Эмпирическое предсказание]]
-*[[Обобщающая способность]] = [[Переобучение]] = [[Переподгонка]]
+*[[Обобщающая способность]] = [[Переобучение]] = [[Переподгонка]] = [[оверфиттинг]]
 *[[Уровень значимости]]
 *[[Теория Вапника-Червоненкиса]]
 *[[Структурная минимизация риска]]
 *[[Минимум длины описания]] = [[MDL]]
-*[[Переподгонка]] = [[переобучение]] = [[оверфиттинг]]
 *[[Скользящий контроль]] = [[Кросс-валидация]] = [[CV]]
 *[[Информационный критерий Акаике]] = [[Критерий Акаике]] = [[AIC]]
@@ Строка 197: / Строка 196: @@
 *[[:Категория:Классификация]]
 *[[Классификация]] = [[Дискриминантный анализ]]
+=== Классификация, распознавание образов ===
+*[[:Категория:Байесовская теория классификации]]
 *[[Байесовский классификатор]]
 *[[Наивный байесовский классификатор]]
-*[[Байесовский вывод]]
-*[[Байесовская сеть]]
 *[[Линейный дискриминант Фишера]]
-*[[Смесь вероятностных распределений]]
+*[[Смесь вероятностных распределений]] = [[Разделение смеси распределений]] = [[Расщепление смеси распределений]]
 *[[EM-алгоритм]]
-*[[Метод ближайшего соседа]] = [[kNN]]
-*[[Метод потенциальных функций]]
 *[[Метод радиальных базисных функций]] = [[Сеть радиальных базисных функций]] = [[RBF]]
 *[[Метод парзеновского окна]]
+=== Классификация на основе сходства ===
+*[[:Категория:Метрические алгоритмы классификации]] (классификация на основе сходства, similarity-based classification)
 *[[Гипотеза компактности]]
 *[[Матрица расстояний]]
 *[[Метрика]] = [[Функция расстояния]] = [[Сходство]]
+*[[Метод ближайшего соседа]] = [[kNN]]
+*[[Метод потенциальных функций]]
+*[[Метод радиальных базисных функций]] = [[Сеть радиальных базисных функций]] = [[RBF]]
+*[[Метод парзеновского окна]]
 *[[Проклятие размерности]]
+*[[CBR]] = [[Case based reasoning]] = [[Рассуждение по прецедентам]] (?)
+=== Классификация на основе разделимости ===
+*[[:Категория:Линейные классификаторы]]
 *[[Машина опорных векторов]] = [[Метод опорных векторов]] = [[SVM]]
+*[[Однослойный персептрон]]
-=== Нейронные сети ===
+=== Байесовский вывод ===
+*[[:Категория:Байесовский вывод]]
+*[[Байесовский вывод]]
+*[[Метод релевантных векторов]] = [[RVM]]
+*[[Байесовская сеть]]
+=== Нейронные сети ===
 *[[:Категория:Нейронные сети]]
-*[[Нейронная сеть]]
+*[[Нейронная сеть]] = [[ANN]]
 *[[Персептрон]]
+*[[Однослойный персептрон]]
 *[[Многослойный персептрон]]
 *[[Метод стохастического градиента]]
 *[[Метод обратного распространения ошибки]] = [[Backpropagation]] = [[Backprop]]
+*[[OBD]] = [[Оптимальное усечение сети]]
-=== Логические алгоритмы классификации ===
+=== Дискретные (логические) алгоритмы классификации ===
+*[[:Категория:Логические алгоритмы классификации]]
 *[[Логическая закономерность]]
 *[[Статистическая закономерность]]
@@ Строка 254: / Строка 271: @@
 *[[Нейронная сеть Кохонена]]
 *[[Ансамбль кластеризаторов]]
-*[[Многомерное шкалирование]]
+*[[Многомерное шкалирование]] = [[MDS]]
 *[[Карта сходства]]
 *[[Сегментация]]
@@ Строка 313: / Строка 330: @@
 === Предварительный анализ данных ===
+*[[:Категория:Предварительный анализ данных]]
 *[[Предварительный анализ данных]] = [[Разведочный анализ данных]]
 *[[Нормальзация данных]]
 *[[Визуализация данных]]
 *[[Понимание данных]]
+Projection pursuit
 === Интеллектуальный анализ данных ===

Участник:Vokov

Материал из MachineLearning.

Версия 19:16, 23 апреля 2008

Содержание

Учебные курсы

Научные интересы

Теория обобщающей способности

Комбинаторная статистика

Алгоритмические композиции

Анализ клиентских сред

Публикации

Софт

Внешние ссылки

Ссылки внутри MachineLearning.RU

Служебные страницы

Шаблоны

Категории

Планы по развитию MachineLearning.RU

Сильно недописанные статьи

Немного недописанные статьи

Базовые понятия

Теория вычислительного обучения

Классификация, распознавание образов

Классификация, распознавание образов

Классификация на основе сходства

Классификация на основе разделимости

Байесовский вывод

Нейронные сети

Дискретные (логические) алгоритмы классификации

Кластерный анализ

Корреляционный и регрессионный анализ

Прогнозирование

Сокращение размерности

Алгоритмические композиции

Предварительный анализ данных

Интеллектуальный анализ данных

Теории, научные школы

Прикладные задачи интеллектуального анализа данных

Мои подразделы

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты