Авторегрессионное скользящее среднее

Материал из MachineLearning.

Перейти к: навигация, поиск

В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.

Имея временной ряд X_t, модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.

Содержание

Авторегрессионная модель

Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p. AR(p) записывается следующим образом:

X_t = c + \sum_{i=1}^p \phi_i X_{t-i} + \epsilon_t,

где \phi_1,\dots,\phi_p — параметры модели, c — константа, а \epsilon_tбелый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при |\phi_1| \ge 1 модель AR(1) не будет обладать свойством стационарности.

Скользящее среднее

Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:

X_t = \sum_{i=1}^q \theta_i \epsilon_{t-i} + \epsilon_t,

где \theta_1,\dots,\theta_q — параметры модели, а \epsilon_t, \dots, \epsilon_{t-q} — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой

Авторегрессионное скользящее среднее

Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):

X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \phi_i X_{t-i},

Погрешности

Обычно значения ошибки \epsilon_t полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: \epsilon_t \sim N \left(0, \sigma^2 \right), где \sigma^2 — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.


Статья в настоящий момент дорабатывается.
Дорофеев Н.Ю. 12:14, 10 декабря 2008 (MSK)


Личные инструменты