Участник:LuarSoll/Песочница
Материал из MachineLearning.
(Различия между версиями)
												
			
			| Строка 1: | Строка 1: | ||
| - | '''Отступ''' (margin) объекта из [[Обучающая выборка|обучающей выборки]] - величина, показывающая степень типичности этого объекта  | + | '''Отступ''' (margin) объекта из [[Обучающая выборка|обучающей выборки]] - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса  | 
==Основная формула==  | ==Основная формула==  | ||
| Строка 19: | Строка 19: | ||
*Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным  | *Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным  | ||
*Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива  | *Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива  | ||
| + | |||
| + | ==Литература==  | ||
| + | {{книга  | ||
| + | |автор        = Воронцов К.В.  | ||
| + | |заглавие     = Лекции по метрическим алгоритмам классификации  | ||
| + | |ссылка       = http://www.machinelearning.ru/wiki/images/9/9d/Voron-ML-Metric.pdf  | ||
| + | }}  | ||
Версия 16:19, 26 декабря 2009
Отступ (margin) объекта из обучающей выборки - величина, показывающая степень типичности этого объекта, "расстояние" от этого объекта до границы класса
Содержание | 
Основная формула
Отступ объекта  относительно алгоритма классификации, имеющего вид 
 - определяется формулой 
Степени типичности объектов
- Эталонные объекты - объекты, имеющие большой положительный отступ, плотно окруженные объектами своего класса и являющиеся наиболее типичными его представителями.
 - Неинформативные объекты - объекты, имеющие положительный отступ. Изъятие их из выборки не влияет на качество классификации.
 - Пограничные объекты - объекты с отступом, близким к нулю. Классификация пограничных ответов неустойчива, малые изменения метрики, параметров алгоритма классификации или обучающей выборки могут изменить их классификацию.
 - Ошибочные объекты - объекты с отрицательным отступом. На них данный алгоритм классификации дает ошибку
 - Шумовые объекты (выбросы) - объекты с большим по модулю отрицательным отступом. Они плотно окружены объектами другого класса и возникают из-за ошибок или недостатка информации в исходных данных.
 
Применение отступов
Для отбора эталонных объектов
- Из обучающей выборки необходимо изъять шумовые объекты, так как их наличие только ухудшает классификацию
 - Без снижения качества классификации из обучающей выборки можно изъять неинформативные объекты, что уменьшит объем хранимой информации и время на ее обработку
 
Для оценки качества выборки
- Если большая часть объектов обучающей выборки имеет положительные отступы, выборку можно считать разделимой
 - Если в выборке много объектов с отрицательными отступами, гипотеза компактности классов не выполняется и применение метрических алгоритмов с данной метрикой для данной задачи классификации является нецелесообразным
 - Если в выборке много объектов с отступами, близкими к нулю, классификация неустойчива
 
Литература
Воронцов К.В. Лекции по метрическим алгоритмам классификации.

