Критерий Пейджа
Материал из MachineLearning.
 (→Литература)  | 
				|||
| (1 промежуточная версия не показана) | |||
| Строка 1: | Строка 1: | ||
'''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.  | '''Критерий Пейджа''' является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.  | ||
| + | |||
| + | ==Примеры задач==  | ||
| + | Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей.  | ||
| + | Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения.  | ||
| + | Каждое значение в выборке - это числовая оценка производительности данного рабочего.  | ||
| + | Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.  | ||
| + | |||
| + | Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей.  | ||
| + | Для каждого такого метода составим выборку из обработанных им полей.  | ||
| + | Значение в выборке равно урожайности данного поля.  | ||
| + | Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.  | ||
==Описание критерия==  | ==Описание критерия==  | ||
| Строка 18: | Строка 29: | ||
При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным:  | При <tex>n > 10</tex> распределение <tex>L(n, k)</tex> можно аппроксимировать нормальным:  | ||
| - | ::<tex>L(n, k) \  | + | ::<tex>L(n, k) \sim N(\frac{nk(k+1)^2}4, \frac{n(k^3-k)^2}{144(k-1)})</tex>.  | 
==Литература==  | ==Литература==  | ||
| Строка 31: | Строка 42: | ||
[[Категория:Прикладная статистика]]  | [[Категория:Прикладная статистика]]  | ||
| + | [[Категория:Непараметрические статистические тесты]]  | ||
Текущая версия
Критерий Пейджа является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.
Содержание | 
Примеры задач
Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.
Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.
Описание критерия
Дано  наблюдений 
, где 
.
Через 
 обозначим гипотезу о равенстве средних для каждой из 
 групп:
.
Для каждого , где 
, упорядочим последовательность
.
Ранг элемента  внутри такой последовательности обозначим через 
.
Очевидно,
.
Статистика критерия имеет вид
,
где
.
Гипотеза  принимается, если 
.
Критические значения 
 находятся при помощи интерполяции табличных данных.
При  распределение 
 можно аппроксимировать нормальным:
.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
 - Page E. B. Ordered hypotheses for multiple treatments: A significance test for linear ranks // JASA. 1963. V. 58. P. 216-230.
 
См. также
Ссылки
- Page's trend test(Wikipedia)
 

