Критерий Колмогорова-Смирнова

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Использование критерия для проверки нормальности)
(Описание критерия)
Строка 19: Строка 19:
Гипотеза <tex>H_0</tex> отвергается, если статистика <tex>\sqrt{n}D_n\!</tex> превышает квантиль распределения <tex>K_\alpha</tex> заданного уровня значимости <tex>\alpha</tex>,
Гипотеза <tex>H_0</tex> отвергается, если статистика <tex>\sqrt{n}D_n\!</tex> превышает квантиль распределения <tex>K_\alpha</tex> заданного уровня значимости <tex>\alpha</tex>,
и принимается в противном случае.
и принимается в противном случае.
 +
 +
== Примечание ==
 +
 +
В критерии Колмогорова целесообразно использовать статистику с поправкой Большева. <ref> Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983.</rer>.
 +
Тогда распределение статистики быстрее сходится к предельному распределению Колмогорова, и зависимостью от объема выборки можно пренебречь при ''n''болше 25.
 +
==Использование критерия для проверки нормальности==
==Использование критерия для проверки нормальности==
При помощи критерия Колмогорова-Смирнова определяется, описывает ли заданная функция наблюдаемое распределение <tex>X</tex>,
При помощи критерия Колмогорова-Смирнова определяется, описывает ли заданная функция наблюдаемое распределение <tex>X</tex>,

Версия 14:52, 19 октября 2013

Критерий Колмогорова-Смирнова используется для проверки гипотезы H_0: "случайная величина X имеет распределение F(x)".

Примеры задач

Критерий Колмогорова-Смирнова уместно применять в тех случаях, когда нужно проверить, подчиняется ли наблюдаемая случайная величина некоторому закону распределения, известному с точностью до параметров. Например, все исходы, выдаваемые рулеткой казино, должны быть равновероятны. Предположим, требуется выяснить, можно ли считать некоторую рулетку "честной". Для этого следует составить достаточно большую выборку из исходов этой рулетки. Чтобы установить, является ли выборка равномерно распределённой, можно воспользоваться критерием Колмогорова-Смирнова.

Описание критерия

Пусть X_n - выборка независимых одинаково распределённых случайных величин, F_n(x) - эмпирическая функция распределения, \Phi(x) - некоторая фиксированная "истинная" функция распределения. Тогда статистика критерия определяется следующим образом:

D_n=\sup_x |F_n(x)-\Phi(x)|.

Обозначим через H_0 гипотезу о том, что выборка подчиняется распределению \Phi(X)\in \mathrm{C}^1(\mathbb{X}). Тогда по теореме Колмогорова для введённой статистики справедливо:

\forall t>0: \quad \lim_{n \to \infty}P(\sqrt{n} D_n \leq t)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j \mathrm{e}^{-2j^2t^2}.

Гипотеза H_0 отвергается, если статистика \sqrt{n}D_n\! превышает квантиль распределения K_\alpha заданного уровня значимости \alpha, и принимается в противном случае.

Примечание

В критерии Колмогорова целесообразно использовать статистику с поправкой Большева. [1]

Личные инструменты