Авторегрессионное скользящее среднее

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

В статистике и обработке сигналов модель авторегрессионного скользящего среднего (autoregressive moving average, ARMA), называемая иногда моделью Бокса-Дженкинса, применяется для исследования временных рядов.

Имея временной ряд $X_t$ , модель авторегрессионного скользящего среднего позволяет объяснить и, возможно, предсказать будущие значения ряда. Модель состоит из двух частей: авторегрессионной (AR) части и скользящего среднего(MA). Для упоминания модели обычно используется обозначение ARMA(p,q), где p — порядок регрессионной части, а q — порядок скользящего среднего.

Содержание

1 Авторегрессионная модель
2 Скользящее среднее
3 Авторегрессионное скользящее среднее
4 Погрешности
5 Определение с помощью оператора задержки
- 5.1 Альтернативные обозначения
6 Модели настройки

Авторегрессионная модель

Сочетание AR(p) используется для обозначения авторегрессионной модели порядка p. AR(p) записывается следующим образом:

$X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t$ ,

где $\varphi_1,\dots,\varphi_p$ — параметры модели, $c$ — константа, а $\epsilon_t$ — белый шум. Для простоты константу зачастую опускают. По сути своей авторегрессионная модель является полюсным фильтром с бесконечной импульсной характеристикой, истолкованным в контексте анализа временных рядов. Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели. Например, при $|\varphi_1| \ge 1$ модель AR(1) не будет обладать свойством стационарности.

Скользящее среднее

Модель скользящего среднего порядка q обозначается MA(q) и записывается следующим образом:

$X_t = \sum_{i=1}^q \theta_i \epsilon_{t-i} + \epsilon_t$ ,

где $\theta_1,\dots,\theta_q$ — параметры модели, а $\epsilon_t, \dots, \epsilon_{t-q}$ — ошибки. Скользящее среднее можно рассматривать, как интерпретацию фильтра с конечной импульсной характеристикой

Авторегрессионное скользящее среднее

Под обозначением ARMA(p,q) понимается модель, содержащая p авторегрессионных составляющих и q скользящих средних. Точнее модель ARMA(p,q) включает в себя модели AR(p) и MA(q):

$X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i}$ ,

Погрешности

Обычно значения ошибки $\epsilon_t$ полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: $\epsilon_t \sim N \left(0, \sigma^2 \right)$ , где $\sigma^2$ — дисперсия. Предположения можно ослабить, но это может привести к изменению свойств модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.

Определение с помощью оператора задержки

Возможно и другое определение модели ARMA — с помощью оператора задержки L. В этом случае авторегрессионная модель AR{p) задаётся формулой
$\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t$
, где $\varphi$ — полином
$\varphi = 1 - \sum_{i=1}^p \varphi_i L^i$ .
Модель MA(q) задаётся следующим образом:
$X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t$
, где $\theta$ — полином
$\theta = 1 - \sum_{i=1}^p \theta_i L^i$ .
Наконец, модель ARMA(p,q) описывается формулой
$\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t$ ,
или коротко
$\varphi X_t = \theta \epsilon_t$ .

Альтернативные обозначения

Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам. Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде. В этих обозначениях модель ARMA(p,q) записывается, как
$\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.$

Модели настройки

После выбора параметров p и q может с помощью метода наименьших квадратов чтобы минимизировать погрешность. Обычно находят наименьшие p и q, при которых модель описывает данные с удовлетворительной точностью. Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.

Статья в настоящий момент дорабатывается.
Nick D. 14:46, 21 января 2009 (MSK)

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%B2%D1%82%D0%BE%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B5_%D1%81%D0%BA%D0%BE%D0%BB%D1%8C%D0%B7%D1%8F%D1%89%D0%B5%D0%B5_%D1%81%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%B5»

Категория: Прогнозирование временных рядов

@@ Строка 9: / Строка 9: @@
 Сочетание AR(<i>p</i>) используется для обозначения [[авторегрессионная модель|авторегрессионной модели]] порядка <i>p</i>.
 AR(<i>p</i>) записывается следующим образом: <br />
-::<tex>X_t = c + \sum_{i=1}^p \phi_i X_{t-i} + \epsilon_t</tex>, <br />
+::<tex>X_t = c + \sum_{i=1}^p \varphi_i X_{t-i} + \epsilon_t</tex>, <br />
-где <tex>\phi_1,\dots,\phi_p</tex> — параметры модели, <tex>c</tex> — константа, а <tex>\epsilon_t</tex> — [[белый шум]].
+где <tex>\varphi_1,\dots,\varphi_p</tex> — параметры модели, <tex>c</tex> — константа, а <tex>\epsilon_t</tex> — [[белый шум]].
 Для простоты константу зачастую опускают.
 По сути своей авторегрессионная модель является [[полюсный фильтр|полюсным]] [[фильтр с бесконечной импульсной характеристикой|фильтром с бесконечной импульсной характеристикой]], истолкованным в контексте анализа временных рядов.
 Для того, чтобы модель была стационарной требуется наложить некоторые ограничения на параметры модели.
-Например, при <tex>|\phi_1| } \ge 1</tex> модель AR(1) не будет обладать свойством стационарности.
+Например, при <tex>|\varphi_1| \ge 1</tex> модель AR(1) не будет обладать свойством стационарности.
 ==Скользящее среднее==
@@ Строка 26: / Строка 26: @@
 Под обозначением ARMA(<i>p,q</i>) понимается модель, содержащая <i>p</i> авторегрессионных составляющих и <i>q</i> скользящих средних. Точнее модель ARMA(<i>p,q</i>) включает в себя модели AR(<i>p</i>) и MA(<i>q</i>):<br />
-::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \phi_i X_{t-i}</tex>, <br />
+::<tex>X_t = c + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} + \sum_{i=1}^p \varphi_i X_{t-i}</tex>, <br />
 ==Погрешности==
-Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к изменнеию свойтв модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.
+Обычно значения ошибки <tex>\epsilon_t</tex> полагают независимыми одинаково распределёнными случайными величинами, взятыми из нормального распределения с нулевым средним: <tex>\epsilon_t \sim N \left(0, \sigma^2 \right)</tex>, где <tex>\sigma^2</tex> — дисперсия. Предположения можно ослабить, но это может привести к изменению свойств модели. Например, если не предполагать независимости и одинакового распределения ошибок, поведение модели существенным образом меняется.
-{{UnderConstruction|[[Участник:Дорофеев Н.Ю.|Дорофеев Н.Ю.]] 12:14, 10 декабря 2008 (MSK)}}
+==Определение с помощью оператора задержки==
+Возможно и другое определение модели ARMA — с помощью [[оператор задержки|оператора задержки]] <i>L</i>.
+В этом случае авторегрессионная модель AR{<i>p</i>) задаётся формулой <br />
+<tex>\epsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \varphi X_t</tex> <br />,
+где <tex>\varphi</tex> — полином <br />
+<tex>\varphi = 1 - \sum_{i=1}^p \varphi_i L^i</tex>. <br />
+Модель MA(<i>q</i>) задаётся следующим образом: <br />
+<tex>X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t = \theta \epsilon_t</tex> <br />,
+где <tex>\theta</tex> — полином <br />
+<tex>\theta = 1 - \sum_{i=1}^p \theta_i L^i</tex>. <br />
+Наконец, модель ARMA(<i>p,q</i>) описывается формулой <br />
+<tex>\left(1 - \sum_{i=1}^p \varphi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t</tex>, <br />
+или коротко <br />
+<tex>\varphi X_t = \theta \epsilon_t</tex>.
+===Альтернативные обозначения===
+Некоторые авторы, такие как, например, Бокс, Дженкинс и Рейнсел (1994) вычисляют авторегрессионные коэффициенты по иным правилам.
+Это позволяет записать полиномы, зависящим от оператора задержки, в схожем виде.
+В этих обозначениях модель ARMA(<i>p,q</i>) записывается, как <br />
+<tex>\left(1 + \sum_{i=1}^p \phi_i L_i \right) X_t = \left(1 + \sum_{i=1}^q \theta_i L_i \right) \epsilon_t.</tex>
+==Модели настройки==
+После выбора параметров <i>p</i> и <i>q</i> может с помощью [[метод наименьших квадратов|метода наименьших квадратов]] чтобы минимизировать погрешность.
+Обычно находят наименьшие <i>p</i> и <i>q</i>, при которых модель описывает данные с удовлетворительной точностью.
+Для настройки "чистой" авторегрессионной модели можно использовать систему уравнений Юла-Уолкера.
+{{UnderConstruction|[[Участник:Дорофеев Н.Ю.|Nick D.]] 14:46, 21 января 2009 (MSK)}}
+[[Категория:Прогнозирование временных рядов]]

Авторегрессионное скользящее среднее

Материал из MachineLearning.

Текущая версия

Содержание

Авторегрессионная модель

Скользящее среднее

Авторегрессионное скользящее среднее

Погрешности

Определение с помощью оператора задержки

Альтернативные обозначения

Модели настройки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты