Участник:LuarSoll/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 26: Строка 26:
|ссылка = http://www.machinelearning.ru/wiki/images/9/9d/Voron-ML-Metric.pdf
|ссылка = http://www.machinelearning.ru/wiki/images/9/9d/Voron-ML-Metric.pdf
}}
}}
 +
 +
==См. также==
 +
[[Метрический классификатор]]

Версия 16:28, 26 декабря 2009

Отступ (margin) объекта из обучающей выборки - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса

Содержание

Основная формула

Отступ объекта x_i \in X^l относительно алгоритма классификации, имеющего вид a(u)=\mathrm{arg}\max_{y\in Y}\Gamma_{y}(u) - определяется формулой M(x_i)=\Gamma_y_i(x_i)-\max_{y \in Y \setminus y_i}\Gamma_y(x_i)

Степени типичности объектов

  • Эталонные объекты - объекты, имеющие большой положительный отступ, плотно окруженные объектами своего класса и являющиеся наиболее типичными его представителями.
  • Неинформативные объекты - объекты, имеющие положительный отступ. Изъятие их из выборки не влияет на качество классификации.
  • Пограничные объекты - объекты с отступом, близким к нулю. Классификация пограничных ответов неустойчива, малые изменения метрики, параметров алгоритма классификации или обучающей выборки могут изменить их классификацию.
  • Ошибочные объекты - объекты с отрицательным отступом. На них данный алгоритм классификации дает ошибку
  • Шумовые объекты (выбросы) - объекты с большим по модулю отрицательным отступом. Они плотно окружены объектами другого класса и возникают из-за ошибок или недостатка информации в исходных данных.

Применение отступов

Для отбора эталонных объектов

Для оценки качества выборки

  • Если большая часть объектов обучающей выборки имеет положительные отступы, выборку можно считать разделимой
  • Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
  • Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива

Литература

Воронцов К.В. Лекции по метрическим алгоритмам классификации.

См. также

Метрический классификатор

Личные инструменты