Участник:Kropotov

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(+ картинка sinc)
(+ библиотека gmm версия 1.10)
Строка 48: Строка 48:
{| style="border:0px;"
{| style="border:0px;"
|-
|-
-
| valign = "top" | Реализация под MatLab алгоритма решения задачи кластеризации с помощью восстановления смеси нормальных распределений. Количество восстанавливаемых компонент смеси может быть определено автоматически с помощью скользящего контроля или с помощью подхода автоматического определения релевантности, описанного в статье [http://www.springerlink.com/content/p3j0060km3357131/ (Vetrov et al., 2010)].
+
| valign = "top" | Реализация под MatLab алгоритмов решения задачи кластеризации с помощью восстановления смеси нормальных распределений с использованием EM-алгоритма, а также вариационного подхода, описанного в книге [http://research.microsoft.com/en-us/um/people/cmbishop/prml/ (Bishop, 2006)]. Количество кластеров может быть определено автоматически по данным с помощью скользящего контроля или с помощью подхода на основе автоматического определения релевантности, описанного в статье [http://www.springerlink.com/content/p3j0060km3357131/ (Vetrov et al., 2010)]. Применение вариационного подхода для восстановления смеси нормальных распределений также позволяет автоматически определить число кластеров в данных.
-
Скачать: [[Media:Gmm_101.rar|gmm V1.01 (RAR, 73 Кб)]]
+
Скачать: [[Media:Gmm_110.rar|gmm V1.10 (RAR, 102 Кб)]]
|[[Изображение:gmm_initial_approximation.jpg|300px|thumb|Пример кластеризации: начальное приближение с 20 кластерами]]
|[[Изображение:gmm_initial_approximation.jpg|300px|thumb|Пример кластеризации: начальное приближение с 20 кластерами]]

Версия 19:54, 12 января 2011


    Кропотов Дмитрий Александрович

м.н.с. Вычислительного Центра РАН

Написать письмо.

Научные интересы

Байесовские методы машинного обучения, методы обучения и вывода в графических моделях, практический интеллектуальный анализ данных

Публикации

Список публикаций см. здесь.

Программные реализации

Обобщенные линейные модели

Реализация под MatLab ряда классических алгоритмов решения задач классификации и регрессии на основе обобщенных линейных моделей, таких как байесовская линейная/логистическая регрессия, метод релевантных векторов и вариационный метод релевантных векторов. Эти алгоритмы просты в использовании и, как правило, обладают высокой скоростью работы. С их помощью можно решать задачи классификации и регрессии, а также осуществлять отбор значимых признаков.

Скачать: glm V1.05 (RAR, 243 Кб)

Пример решения задачи регрессии: восстановление зашумленной функции sinc
Пример решения задачи регрессии: восстановление зашумленной функции sinc

Табулярный метод релевантных векторов

Реализация под MatLab алгоритма решения задач классификации и регрессии с т.н. табулярными данными. В таких задачах каждый объект выборки представлен своей матрицей признаков, и представляет интерес поиск информативных строк и столбцов в этой матрице. Реализованный алгоритм — это вариационный метод релевантных векторов для табулярных данных, описанный в статье (Kropotov et al., 2010).

Скачать: gridrvm V1.00 (RAR, 158 Кб)

Матрица признаков одного объекта
Матрица признаков одного объекта
Только часть строк и столбцов матрицы являются информативными
Только часть строк и столбцов матрицы являются информативными

Смесь нормальных распределений

Реализация под MatLab алгоритмов решения задачи кластеризации с помощью восстановления смеси нормальных распределений с использованием EM-алгоритма, а также вариационного подхода, описанного в книге (Bishop, 2006). Количество кластеров может быть определено автоматически по данным с помощью скользящего контроля или с помощью подхода на основе автоматического определения релевантности, описанного в статье (Vetrov et al., 2010). Применение вариационного подхода для восстановления смеси нормальных распределений также позволяет автоматически определить число кластеров в данных.

Скачать: gmm V1.10 (RAR, 102 Кб)

Пример кластеризации: начальное приближение с 20 кластерами
Пример кластеризации: начальное приближение с 20 кластерами
Пример кластеризации: финальная кластеризация на 5 кластеров
Пример кластеризации: финальная кластеризация на 5 кластеров

Реализации выполнены при поддержке РФФИ (проекты 09-01-12060, 09-01-92474).

Учебные курсы

Спецкурс «Байесовские методы машинного обучения»
Спецкурс «Структурные методы анализа изображений и сигналов»
Спецсеминар «Байесовские методы машинного обучения»

Личные инструменты