Участник:LuarSoll/Песочница

Материал из MachineLearning.

Перейти к: навигация, поиск

Отступ (margin) объекта из обучающей выборки - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса

Содержание

Основная формула

Отступ объекта x_i \in X^l относительно алгоритма классификации, имеющего вид a(u)=\mathrm{arg}\max_{y\in Y}\Gamma_{y}(u) - определяется формулой M(x_i)=\Gamma_y_i(x_i)-\max_{y \in Y \setminus y_i}\Gamma_y(x_i)

Степени типичности объектов

  • Эталонные объекты - объекты, имеющие большой положительный отступ, плотно окруженные объектами своего класса и являющиеся наиболее типичными его представителями.
  • Неинформативные объекты - объекты, имеющие положительный отступ. Изъятие их из выборки не влияет на качество классификации.
  • Пограничные объекты - объекты с отступом, близким к нулю. Классификация пограничных ответов неустойчива, малые изменения метрики, параметров алгоритма классификации или обучающей выборки могут изменить их классификацию.
  • Ошибочные объекты - объекты с отрицательным отступом. На них данный алгоритм классификации дает ошибку
  • Шумовые объекты (выбросы) - объекты с большим по модулю отрицательным отступом. Они плотно окружены объектами другого класса и возникают из-за ошибок или недостатка информации в исходных данных.

Применение отступов

Для отбора эталонных объектов

Для оценки качества выборки

  • Если большая часть объектов обучающей выборки имеет положительные отступы, выборку можно считать разделимой
  • Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
  • Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива

Литература

Воронцов К.В. Лекции по метрическим алгоритмам классификации.

Личные инструменты