Экспоненциальное сглаживание

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Проблемы)
(Ссылки)
Строка 74: Строка 74:
[http://en.wikipedia.org/wiki/Exponential_smoothing The exponential moving average]
[http://en.wikipedia.org/wiki/Exponential_smoothing The exponential moving average]
-
[[Категория:Анализ временных рядов]]
+
[[Категория:Регрессионный анализ]]
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]

Версия 17:32, 23 апреля 2009

Содержание

Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.

Пусть X=\{x_1, \dots x_T\} - временной ряд.

Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле: S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;,  \alpha \in (0,1).

Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.

Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю S_t можно выразить через значения временного ряда X.

S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0.

Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального значения S_0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.

После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Постановка задачи

Пусть задан временной ряд: y_i \dots y_t,\; y_i \in R.

Необходимо решить задачу прогнозирования временного ряда, т.е. найти

\hat{y}_{t+d}=f_{t,d}\left (y_1 \dots y_t \right),\; d \in \left{1,2, \dots D\right},\; D- горизонт прогнозирования, необходимо, чтобы

Q_T=\sum_{i=1}^T \left( y_i-\hat{y}_i \right) \rightarrow min

Для того, чтобы учитывать устаревание данных, введем невозрастающую последовательность весов w_0,w_1, \dots w_T,\; w_i \geq 0 , тогда

Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min

Модель Брауна

Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют модель Брауна .

\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1).

Если рассматривать прогноз на 1 шаг вперед, то \left(y_t - \hat{y}_t\right) - погрешность этого прогноза, а новый прогноз \hat{y}_{t+1} получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптации.

При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний. Т.о. следует увеличивать вес более свежих наблюдений:  \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t.

С другой стороны, для сглаживания случайных отклонений, α нужно уменьшить:  \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t.

Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3).

Примеры

Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.

Проблемы

Модель работает только при небольшом горизонте прогнозирования. Не учитываются тренд и сезонные изменения. Чтобы учесть их влияние, предлагается использовать модели: Хольта (учитывается линейный тренд) Хольта-Уинтерса (мультипликативные экспоненциальный тренд и сезонность), Тейла-Вейджа (аддетивные линейный тренд и сезонность).

Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.

Brown R.G. Smoothing forecasting and prediction of discrete time series. - N.Y., 1963.

Brown R.G., Meyer R.F. The fundamental theorum of exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.

См. также

Модель Хольта — учитываются линейный тренд без сезонности.

Модель Хольта-Уинтерса — учитываются мультипликативный тренд и сезонность.

Модель Тейла-Вейджа — учитываются аддитивный тренд и сезонность.

Ссылки

The exponential moving average

Личные инструменты