Метод потенциальных функций с размещением реперных объектов в 1 классе

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Аннотация

Пусть имеется пространство объектов S и конечное множество имён классов Y, |Y|=l. На множестве S задана функция расстояния \rho:S \times S \to [0,\infty). Существует целевая зависимость y^*:S \to Y, значения которой известны только на объектах обучающей выборки S^m = (s_i,y_i)_{i=1}^m, \; y_i=y^*(s_i). Требуется построить алгоритм классификации a:S \to Y, аппроксимирующий целевую зависимость y^*(s) на всём множестве S.

Метод потенциальных функций яляется метрическим методом. Основная идея метода состоит в том, что объектам из обучающей выборки присваивается "заряд", который "притягивает" классифицируемый объект к соответствующему классу.

Описание работы модели

Для каждого из классов y_1,\ldots,y_l модель по поступившему объекту x \in S вычисляет оценки \Gamma_1(x),\ldots,\Gamma_l(x) по правилу

(1)
\Gamma_j(x)=\sum_{i=1}^m[y_i=j]\omega_iK(\rho(x,s_i)),

где [y_i=j]=\left\{ 1, y_i=j, \\ 0, y_j \ne j\right,, \; \rho(x,s_i) - метрика, K(z) - ядро (некая невозрастающая на [0,\infty) функция.

Допустим, что модель обучена. Рассмотрим её работу на конкретных примерах:

Описание вычисления оценок

Оценки для каждого класса вычисляются по формуле (1). По вычисленным оценкам получаем окончательный ответ согласно решающему правилу

(2)
C(\Gamma_1,\ldots,\Gamma_l)=arg\max_{y_i}(\Gamma_1\ldots\Gamma_l).

Если существуют \Gamma_i, \Gamma_j, такие что \Gamma_i=\Gamma_j=\max(\Gamma_1\ldots\Gamma_l), то можно сказать, что  x \in y_i, y_j.

Параметры модели

Обозначение Множество значений Наименование/интерпретация
(s_i,y_i) S^m Эталонные объекты и соответствующие ответы
w_i {\mathbb R}^+ Веса эталонных объектов ("заряды")
K(z) [0,\infty) Ядро (невозрастающая на [0,\infty) функция)
\rho(a,b) [0,\infty) метрика

Ссылки

Список литературы

  • Воронцов К.В. Лекции по метрическим алгоритмам классификации
Личные инструменты