Пропорциональный выбор

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск

Коликова Катя (Обсуждение | вклад)
(Новая: Задана совокупность наблюдений, объединенных некоторым общим признаком. Предположим, что эта совоку...)
К следующему изменению →

Версия 20:07, 2 января 2010

Задана совокупность наблюдений, объединенных некоторым общим признаком. Предположим, что эта совокупность бесконечна в том смысле, что в принципе наблюдения можно продолжить в любой момент времени, как, например, в серии бросаний монеты. Из этой совокупности "случайным образом" извлекается последовательность наблюдений. Если число этих наблюдений достаточно велико, то частота появления событий, обладающих указанным признаком, незначительно отклоняется от некоторой постоянной, называемой эмпирической вероятностью. На практике ответить на вопрос о том, может ли выбор из нашей совокупности рассматриваться как случайный, нелегко. Чаще всего этой несколько расплывчатой формулировкой о случайном выборе пользуются тогда, когда нет оснований предполагать наличие "привилегированных" наблюдений. В этой связи часто говорят об "урновой" модели. Содержимое урны, например шары, неразличимые на ощупь, представляет совокупность, а извлечение шаров, которые мы предполагаем хорошо перемешанными, - случайный выбор.

Целью такого случайного выбора из совокупности является выяснение ее структуры, в частности определение эмпирической вероятности. Здесь отчасти используется то эвристическое соображение, что при бесконечно большом числе наблюдений можно точно определить значение эмпирической вероятности. Практически же проведение произвольно большого числа опытов или наблюдений связано с трудностями различных характеров. Так, проведение большого числа опытов наталкивается на техническую невыполнимость или на экономические затруднения, что приводит к ограничению числа наблюдений. Приближение к идеальным условиям, которое имеет место в случае игр на разорение, в большинстве практически важных ситуаций не имеет места.

Установилась следующая терминология. Бесконечная (гипотетическая) совокупность возможных наблюдений называется генеральной совокупностью, и результаты наблюдений, из нее извлеченных, называются выборкой из этой совокупности. Число наблюдений в выборке называют ее объемом. Понятие бесконечной совокупности представляет идеализацию действительного положения вещей, даже когда под этим понимается потенциальная возможность неограниченного повторения опытов. Практик рассматривает всякую совокупность, "достаточно большую" по сравнению с объемом имеющейся выборки, как бесконечную.

Личные инструменты