Проверка гипотезы наличия тренда для количества посетителей сервиса "Яндекс Кубок"
Материал из MachineLearning.
м («Проверка гипотезы наличия тренда для количества посетителей сервиса "Яндекс Пробки"» переименована в «[[Проверка гипотезы наличия трен) |
|||
Строка 1: | Строка 1: | ||
- | Дана статистика числа посетителей сервиса "Яндекс Кубок" с марта 2001 года по ноябрь 2008 года. | + | Дана статистика числа посетителей сервиса "[http://kubok.yandex.ru|Яндекс Кубок]" с марта 2001 года по ноябрь 2008 года. |
Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность <tex>\alpha = 0.95</tex>. | Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность <tex>\alpha = 0.95</tex>. | ||
Строка 75: | Строка 75: | ||
*[[Критерий Фостера-Стюарта]] | *[[Критерий Фостера-Стюарта]] | ||
*[[Критерий Кокса-Стюарта]] | *[[Критерий Кокса-Стюарта]] | ||
+ | *[[Проверка гипотезы наличия тренда для количества посетителей сервиса "Яндекс Открытки"]] | ||
[[Категория:Учебные задачи]] | [[Категория:Учебные задачи]] |
Версия 19:05, 11 января 2009
Дана статистика числа посетителей сервиса "Кубок" с марта 2001 года по ноябрь 2008 года. Необходимо проверить гипотезу наличия тренда в выборке с доверительной вероятность .
График числа посещений изображен ниже, сами данные, вследствие открытого доступа к ним и их размера не представлены.
Здесь пики приходятся на время проведения кубков Яндекса по поиску в интернете, в остальное время число посетителей мало.
Проверим, есть ли здесь тренд.
Так как мы не можем сказать, что распределение нормально и дисперсия постоянна, то критерий Аббе-Линника здесь не применим.
Сначала воспользуемся критерием Фостера-Стюарта.
Статистика критерия для средних имеет вид
- ,
где
- если , то , в противном случае
- если , то , в противном случае
Получилось
При отсутствии тренда величина
- , где
имеет распределение Стьюдента с степенями свободы.
После вычислений получаем: .
-квантиль распределения Стьюдента с степенями свободы
, поэтому гипотеза отсутствия трендов отклоняется.
Теперь воспользуемся критерием Кокса-Стюарта.
Сначала посчитаем статистику :
- , где
Получилось:
Теперь посчитаем нормализованную статистику
- , где
- и
- .
Получилось
При гипотеза тренда среднего отклоняется ( - -квантиль нормального распределения).
, гипотеза тренда принимается.
В заключение, стоит отметить, что критерий Кокса-Стюарта намного более быстрый чем критерий Фостера-Стюарта. Если в критерие Кокса-Стюарта сложность вычислений зависит линейно от объема данных, то в критерие Фостера-Стюарта зависимость квадратичная. Поэтому при больших объемах данных критерий Кокса-Стюарта оказывается более предпочтительным.
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.