Экспоненциальное сглаживание

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Ссылки)
 
(9 промежуточных версий не показаны.)
Строка 38: Строка 38:
<tex>\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1)</tex>.
<tex>\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1)</tex>.
-
Если рассматривать прогноз на 1 шаг вперед, то <tex>(y_t \hat{y}_t)</tex> - погрешность этого прогноза, а новый прогноз <tex>\hat{y}_{t+1}</tex> получается в результате корректировки
+
Если рассматривать прогноз на 1 шаг вперед, то <tex>\left(y_t - \hat{y}_t\right)</tex> - погрешность этого прогноза, а новый прогноз <tex>\hat{y}_{t+1}</tex> получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптации.
-
предыдущего прогноза с учетом его ошибки - суть адаптация.
+
При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний.
При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний.
-
Т.о., следует увеличивать вес более свежих наблюдений: <tex> \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t</tex>.
+
Т.о. следует увеличивать вес более свежих наблюдений: <tex> \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t</tex>.
-
С другой стороны, для сглаживания случайных отклонений α нужно уменьшить: <tex> \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t</tex>.
+
С другой стороны, для сглаживания случайных отклонений, α нужно уменьшить: <tex> \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t</tex>.
-
Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3), в этом случае ряд стационарен и использование модели Брауна оправдано.
+
Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3).
== Примеры ==
== Примеры ==
 +
[[Image: SalesExpSmooth.png|420px|thumb|]]
Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.
Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.
-
[[Image: SalesExpSmooth.png|300px|thumb|]]
 
== Проблемы ==
== Проблемы ==
Модель работает только при небольшом горизонте прогнозирования.
Модель работает только при небольшом горизонте прогнозирования.
-
Не учитываются [[Тренд|тренд]] и [[Сезонность|сезонные]] изменения.
+
Не учитываются [[Тренд|тренд]] и [[Сезонность|сезонные]] изменения. Чтобы учесть их влияние, предлагается использовать модели: [[Модель Хольта| Хольта]] (учитывается линейный тренд) [[Модель Хольта-Уинтерса| Хольта-Уинтерса]] (мультипликативные экспоненциальный тренд и сезонность), [[Модель Тейла-Вейджа| Тейла-Вейджа]] (аддетивные линейный тренд и сезонность).
 +
 
== Литература==
== Литература==
''Лукашин Ю. П.'' Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.
''Лукашин Ю. П.'' Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.
 +
''Brown R.G.'' Smoothing forecasting and prediction of discrete
''Brown R.G.'' Smoothing forecasting and prediction of discrete
time series. - N.Y., 1963.
time series. - N.Y., 1963.
 +
''Brown R.G., Meyer R.F.'' The fundamental theorum of
''Brown R.G., Meyer R.F.'' The fundamental theorum of
exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.
exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.
 +
== См. также ==
== См. также ==
Строка 71: Строка 74:
[http://en.wikipedia.org/wiki/Exponential_smoothing The exponential moving average]
[http://en.wikipedia.org/wiki/Exponential_smoothing The exponential moving average]
-
[[Категория:Категория:Анализ временных рядов]]
+
[[Категория:Регрессионный анализ]]
 +
[[Категория:Прогнозирование временных рядов]]
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]

Текущая версия

Содержание

Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда. Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней.

Пусть X=\{x_1, \dots x_T\} - временной ряд.

Экспоненциальное сглаживание ряда осуществляется по рекуррентной формуле: S_t=\alpha x_t + \left( 1-\alpha \right) S_{t-1},\;,  \alpha \in (0,1).

Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.

Если последовательно использовать рекуррентное это соотношение, то экспоненциальную среднюю S_t можно выразить через значения временного ряда X.

S_t =\alpha x_t + (1-\alpha)\left( \alpha x_{t-1} + (1-\alpha)S_{t-2}\right)= \dots = \alpha \sum_{i=0}^{t-1} (1-\alpha)^i x_{t-i} + (1-\alpha)^t S_0.

Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального значения S_0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.

После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Постановка задачи

Пусть задан временной ряд: y_i \dots y_t,\; y_i \in R.

Необходимо решить задачу прогнозирования временного ряда, т.е. найти

\hat{y}_{t+d}=f_{t,d}\left (y_1 \dots y_t \right),\; d \in \left{1,2, \dots D\right},\; D- горизонт прогнозирования, необходимо, чтобы

Q_T=\sum_{i=1}^T \left( y_i-\hat{y}_i \right) \rightarrow min

Для того, чтобы учитывать устаревание данных, введем невозрастающую последовательность весов w_0,w_1, \dots w_T,\; w_i \geq 0 , тогда

Q_T=\sum_{i=1}^T w_{T-i} \left( y_i-\hat{y}_i \right) \rightarrow min

Модель Брауна

Предположим, что D - невелико (краткосрочный прогноз), то для решения такой задачи используют модель Брауна .

\hat{y}_{t+d}=\alpha y_t + ( 1-\alpha ) \hat{y}_t,\; \hat{y}_0 = y_0,\; \alpha \in (0,1).

Если рассматривать прогноз на 1 шаг вперед, то \left(y_t - \hat{y}_t\right) - погрешность этого прогноза, а новый прогноз \hat{y}_{t+1} получается в результате корректировки предыдущего прогноза с учетом его ошибки - суть адаптации.

При краткосрочном прогнозировании желательно как можно быстрее отразить новые изменения и в то же время как можно лучше «очистить» ряд от случайных колебаний. Т.о. следует увеличивать вес более свежих наблюдений:  \alpha \rightarrow 1,\; \hat{y}_{t+d} \rightarrow y_t.

С другой стороны, для сглаживания случайных отклонений, α нужно уменьшить:  \alpha \rightarrow 0,\; \hat{y}_{t+1} \rightarrow \bar{y}_t.

Т.о. эти два требования находятся в противоречии. Поиск компромиссного значения α составляет задачу оптимизации модели. Обычно, α берут из интервала (0,1/3).

Примеры

Работа экспоненциального сглаживания при α=0.2 на данных ежемесячных отчетов по продажам иностранной автомобильной марки в России за период с января 2007 по октябрь 2008. Отметим резкие падения в январе и феврале, когда продажи традиционно снижаются и повышения в начале лета.

Проблемы

Модель работает только при небольшом горизонте прогнозирования. Не учитываются тренд и сезонные изменения. Чтобы учесть их влияние, предлагается использовать модели: Хольта (учитывается линейный тренд) Хольта-Уинтерса (мультипликативные экспоненциальный тренд и сезонность), Тейла-Вейджа (аддетивные линейный тренд и сезонность).

Литература

Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. — М.: Финансы и статистика, 2003.

Brown R.G. Smoothing forecasting and prediction of discrete time series. - N.Y., 1963.

Brown R.G., Meyer R.F. The fundamental theorum of exponential smoothing. Oper. Res. - 1961. - Vol.9. -№ 5.

См. также

Модель Хольта — учитываются линейный тренд без сезонности.

Модель Хольта-Уинтерса — учитываются мультипликативный тренд и сезонность.

Модель Тейла-Вейджа — учитываются аддитивный тренд и сезонность.

Ссылки

The exponential moving average

Личные инструменты