Разнообразие
Материал из MachineLearning.
|   | Данная статья является непроверенным учебным заданием. 
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. | 
Концепция разнообразия играет важную роль в  теории Вапника-Червоненкиса. Разнообразие класса связано с такими ключевыми понятиями, как  коэффициент разнообразия,  функция роста,  размерность Вапника-Червоненкиса.
Разнообразие класса
Пусть имеются  - класс множеств и некоторое множество 
. Говорят, что  
 имеет разнообразие 
 (
 to shatter 
), если для любого подмножества 
 существует 
 такой, что 
.
Альтернативная формулировка:  имеет разнообразие 
, если 
 — булеан (множество всех подмножеств) совпадает с множеством 
.
Пример: класс  — класс полуплоскостей плоскости, 
 — множество из произвольных 4 точек на плоскости. 
 не имеет разнообразия 
, поскольку всегда можно выбрать такие две точки из множества 4 точек на плоскости, что нельзя отделить эти две точки от оставшихся двух с помощью ограничивающей полуплоскость прямой. 
Рассмотрим задачу классификации на два класса. Пусть  множество  — множество объектов; 
 - множество ответов; класс множеств 
 — класс алгоритмов, множество целевых функций вида 
; 
 — подмножество 
 мощности 
. Класс алгоритмов 
 имеет многообразие 
 (разбивает 
), если для любого подмножества 
 множества  
 существует алгоритм из класса 
,  отделяющий объекты из 
 от объектов из 
.
Литература
- Anselm Blumer, Andrzej Ehrenfeucht, David Haussler, and Manfred K. Warmuth. Learnability and the Vapnik-Chervonenkis dimension. Journal of the Association for Computing Machinery, 36(4):929-965, October 1989.

