Критерий Пейджа
Материал из MachineLearning.
(→Литература) |
|||
| (1 промежуточная версия не показана) | |||
| Строка 1: | Строка 1: | ||
'''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | '''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных. | ||
| + | |||
| + | ==Примеры задач== | ||
| + | Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. | ||
| + | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. | ||
| + | Каждое значение в выборке - это числовая оценка производительности данного рабочего. | ||
| + | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей. | ||
| + | |||
| + | Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. | ||
| + | Для каждого такого метода составим выборку из обработанных им полей. | ||
| + | Значение в выборке равно урожайности данного поля. | ||
| + | Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая. | ||
==Описание критерия== | ==Описание критерия== | ||
| Строка 18: | Строка 29: | ||
При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным: | При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным: | ||
| - | ::<tex>L(n, k) \ | + | ::<tex>L(n, k) \sim N(\frac{nk(k+1)^2}4, \frac{n(k^3-k)^2}{144(k-1)})</tex>. |
==Литература== | ==Литература== | ||
| Строка 31: | Строка 42: | ||
[[Категория:Прикладная статистика]] | [[Категория:Прикладная статистика]] | ||
| + | [[Категория:Непараметрические статистические тесты]] | ||
Текущая версия
Критерий Пейджа является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.
Содержание |
Примеры задач
Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.
Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.
Описание критерия
Дано наблюдений
, где
.
Через
обозначим гипотезу о равенстве средних для каждой из
групп:
.
Для каждого , где
, упорядочим последовательность
.
Ранг элемента внутри такой последовательности обозначим через
.
Очевидно,
.
Статистика критерия имеет вид
,
где
.
Гипотеза принимается, если
.
Критические значения
находятся при помощи интерполяции табличных данных.
При распределение
можно аппроксимировать нормальным:
.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Page E. B. Ordered hypotheses for multiple treatments: A significance test for linear ranks // JASA. 1963. V. 58. P. 216-230.
См. также
Ссылки
- Page's trend test(Wikipedia)

