Критерий Стьюдента
Материал из MachineLearning.
t-Критерий Стьюдента — общее название для статистических тестов), в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух нормальных выборках.
Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить проверку нормальности.
Сравнение выборочного среднего с заданным значением
Задана выборка .
Дополнительное предположение: выборка нормальна.
Нулевая гипотеза (среднее равно
).
Статистика критерия:
имеет распределение Стьюдента с степенями свободы,
где
— выборочное среднее,
— выборочная дисперсия.
Критерий (при уровне значимости ):
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
где
есть
-квантиль распределения Стьюдента с
степенями свободы.
Сравнение двух выборочных средних при известных дисперсиях
Заданы две выборки .
Дополнительные предположения:
- обе выборки нормальны;
- значения дисперсий
известны априори; это означает, что дисперсии были оценены заранее не по этим выборкам, а исходя из какой-то другой информации; случай, когда такого источника информации нет и дисперсии приходится оценивать по самим выборкам, описан ниже.
Нулевая гипотеза (средние в двух выборках равны).
Статистика критерия:
,
имеет стандартное нормальное распределение ,
где
— выборочные средние.
Критерий (при уровне значимости ):
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
- если
, то нулевая гипотеза отвергается;
- если
где
есть
-квантиль стандартного нормального распределения.
Сравнение двух выборочных средних при неизвестных равных дисперсиях
Сравнение двух выборочных средних при неизвестных неравных дисперсиях
Сравнение двух выборочных средних в связанных выборках
История
Критерий был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
Ссылки
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Student's t-test — статья в англоязычной Википедии.
- t-критерий Стьюдента — статья в русской Википедии.