Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/1
Материал из MachineLearning.
Ниже под обозначением понимается выборка объёма
из смеси нормального
и равномерного
распределений с весами
и
соответственно (при генерации каждой выборки используется случайный датчик — если его значение не превосходит
, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного).
Содержание |
Анализ поведения схожих критериев
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого критерия.
- сравнить z-критерий и точный критерий для доли.
- сравнить критерии, основанные на доверительных интервалах Вальда и Уилсона (нулевая гипотеза отвергается на уровне значимости 5%, если 95% доверительный интервал для параметра не содержит
).
-
среднее значение
равно нулю,
среднее значение
не равно нулю;
- сравнить одновыборочные t- и z-критерии.
- сравнить одновыборочный t-критерий и критерий знаковых рангов Уилкоксона.
- сравнить одновыборочный перестановочный критерий и критерий знаковых рангов Уилкоксона.
-
Сравнить критерий Фишера и WM-критерий.
-
Сравнить WM-критерий и критерий Зигеля-Тьюки.
-
Сравнить критерий Фишера и критерий Зигеля-Тьюки.
-
-
неверна;
-
Сравнить критерий Шапиро-Уилка и критерий Колмогорова-Смирнова.
-
Сравнить критерий Смирнова-Крамера-фон Мизеса и критерий Жарка-Бера.
-
Сравнить критерий Колмогорова-Смирнова и критерий хи-квадрат.
-
Анализ устойчивости критериев к нарушению предположений
Требуется исследовать поведение указанного критерия в условиях нарушения лежащих в его основе предположений. Оценить мощность и достигаемый уровень значимости критерия при различных значениях параметров, сделать выводы об устойчивости.
- Одновыборочный t-критерий, нарушение предположения о нормальности.
- Воронов:
-
- Воронов:
- Критерий Фишера для проверки равенства дисперсий, нарушение предположения о нормальности.
- Критерий Зигеля-Тьюки, нарушение предположения о равенстве медиан.
- Двухвыборочный t-критерий, нарушение предположения о равенстве дисперсий.
Анализ двухэтапных процедур проверки гипотез
Требуется построить описанную двухэтапную процедуру проверки гипотез и сравнить вероятности совершения ей ошибок первого и второго рода при уровне значимости с аналогичными показателями каждого из критериев второго этапа. Сделать выводы о корректности применения двухэтапной процедуры.
- Одновыборочная гипотеза о среднем с предварительной проверкой нормальности. Если нормальность отвергается на уровне значимости
, используется критерий знаковых рангов, иначе — t-критерий.
-
Нормальность проверяется критерием Шапиро-Уилка.
-
Нормальность проверяется критерием Смирнова-Крамера-фон Мизеса.
-
Нормальность проверяется критерием Лиллиефорса.
-
- Двухвыборочная гипотеза о равенстве средних с предварительной проверкой нормальности. Если нормальность хотя бы одной из выборок отвергается на уровне значимости
, используется критерий Уилкоксона-Манна-Уитни, иначе — критерий Аспина-Уэлша.
-
Нормальность проверяется критерием Лиллиефорса.
-
Нормальность проверяется критерием Смирнова-Крамера-фон Мизеса.
-
Нормальность проверяется критерием Шапиро-Уилка.
-
Нормальность проверяется критерием хи-квадрат.
-
- Двухвыборочная гипотеза о равенстве средних с предварительной проверкой равенства дисперсий. Равенство дисперсий проверяется критерием Фишера, если оно отвергается на уровне значимости
, используется критерий Аспина-Уэлша, иначе — t-критерий для неизвестных равных дисперсий.