Критерий Диболда-Мариано

Материал из MachineLearning.

Версия от 18:46, 23 января 2014; Newo (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Содержание

1 Описание
2 Дополнительно
3 Программные реализации
4 Ссылки

Критерий Диболда-Мариано (Diebold-Mariano test) -- статистический тест, позволяющий сравнивать качество прогнозов временного ряда двух предсказательных моделей. Впервые был представлен в работе Диболда и Мариано в 1995 году, где был приведен небольшой обзор тестов такого рода. Этот тест является устойчивым к различным отклонениям от стандартных предположенный о свойствах ошибок прогнозирования. А именно предполагается, что ошибки прогнозирования могут не удовлетворять классическим критериям, т.е. могут не быть нормальными, иметь ненулевой средний уровень, а также быть серийно и одновременно коррелированными.

Описание

Пусть $\{y_t\}_{t=1}^T$ , $\{y_{At}\}_{t=1}^T$ -- прогнозные значения модели A, $\{y_{Bt}\}_{t=1}^T$ -- прогнозные значения модели B, $\{e_{At}\}_{t=1}^T$ и $\{e_{Bt}\}_{t=1}^T$ -- остатки прогнозов обеих моделей, $g(e)$ -- функция потерь, $d_{t} = g(e_{At}) - g(e_{Bt}), t=1...T$ .

Если $\{d_{t}\}_{t=1}^T$ является слабостационарным временным рядом, то можно показать, что $\sqrt T(\bar d - \mu) \stackrel{d}{\longrightarrow} N(0, f)$ , где $\bar d =\frac1T \sum_1^{T} d_t$ , $\mu$ - неизвестное матожидание процесса, $f$ - его дисперсия. Проверямая в критерии гипотеза $H_0$ : $\mathbf{E}d=0$ , альтернатива (двусторонняя): $\mathbf{E}d\neq0$ . Вычисляемая статистика: $S=\frac{\bar d}{\sqrt{(\bar f / T)}}$ , где $\bar f = \sum_{t=-\infty}^{t=\infty}\gamma_d(\tau)$ , где $\gamma_d(\tau)$ -- автоковариация $d$ порядка $\tau$ . Гипотезе $H_0$ соответствует $: S \sim N(0, 1)$ .

Дополнительно

Рассмотренный способ проверки гипотезы о совпадении каче�ства прогнозов, основанных на различных моделях, является на�дежным для широкого класса функций потерь. В частности, функ�ции потерь не обязаны быть квадратическими или симметричными и непрерывными. Помимо этого, отметим еще раз, что ошибки прогнозирования могут не быть гауссовскими, а также могут иметь ненулевой средний уровень и быть коррелированными (как серий�но, так и одновременно). Последнее допущение особенно важно, поскольку сравниваемые прогнозы являются прогнозами одного и того же временного ряда и основаны на довольно сильно совпа�дающих информационных множествах, вследствие чего ошибки прогнозирования могут быть сильно одновременно коррелирован�ными. Однако ошибки прогнозирования в общем случае являются серийно коррелированными, и предложенный тест позволяет учи�тывать и эту особенность.

Также возможны модификации критерия для односторонних альтернатив и для коротких временных рядов.