Прогнозирование финансовых пузырей (пример)
Материал из MachineLearning.
 (Новая: == Аннотация ==   Рассматривается метод прогнозирования финансовых пузырей  на основании информации, д...)  | 
				 (→Смотри также)  | 
			||
| (5 промежуточных версий не показаны.) | |||
| Строка 29: | Строка 29: | ||
== Пути решения задачи ==  | == Пути решения задачи ==  | ||
| - | + | ||
| + | Временной ряд - это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Множеством меток называется конечное множество <tex>M=(m_1,\dots,m_r)</tex>. Множество меток задается экспертом. Пример множества меток: <tex>M = \{up, down, plt\}</tex>, где “<tex>up</tex>” -  метка для обозначения точек возрастания, “<tex>down</tex>” - убывания, “<tex>plt</tex>” - метка для обозначения плато.  | ||
| + | |||
| + | Фиксируем множество меток <tex>M</tex>. Определим разбиение временного ряда на сегменты  | ||
| + | <tex>\bar{s}=(s_1,\dots,s_V)</tex>: <tex>s_k=\{x_i,x_{i+1},\dots,x_{i+l_k}\}</tex>, <tex>s_{k_1} \cup s_{k_2} = \emptyset</tex>  | ||
| + | при <tex>k_1 \ne k_2</tex>, <tex>\bigcup\limits_{k=1}^V s_k = \{x_1,\dots,x_T\}</tex>. Разметкой временного ряда  | ||
| + | <tex>\{x_t\}_{t=1}^T</tex> назовем пару <tex>(\bar{s},\bar{m})</tex>: <tex>\bar{m}=(m_1,\dots,m_U)</tex>,  | ||
| + | <tex>m_i \in M</tex>.  | ||
| + | |||
| + | Основная рассматриваемая задача: разметка временного ряда и определение на её основании сходства временных рядов, синтез и выбор наиболее информативных признаков.  | ||
| + | |||
| + | Предлагается использовать следующие признаки.  | ||
| + | |||
| + | 1. Бинарные признаки --- наличие в данном временном ряде определенной комбинации повышений и падений цены.  | ||
| + | |||
| + | 2. Действительный признаки --- суммарное изменение цены на этом интервале.  | ||
| + | |||
| + | Предлагается использовать для построения классификатора логистическую регрессию, а для оценки качества модели - площадь под ROC-кривой. Настройка параметров логистической функции производится градиентными методами оптимизации. Для отбора наилучшей модели рассматривается генетический алгоритм.  | ||
| + | |||
== Смотри также ==   | == Смотри также ==   | ||
| - | * [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/  | + | * [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2010FinancialBubbles/doc Ссылка на текст статьи]  | 
| - | * [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/  | + | * [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2010FinancialBubbles/code Ссылка на код]  | 
| - | + | ||
| - | {{  | + | {{ЗаданиеВыполнено|Даниил Кононенко|В.В.Стрижов|24 декабря 2010|Ivanov|Strijov}}  | 
[[Категория:Практика и вычислительные эксперименты]]  | [[Категория:Практика и вычислительные эксперименты]]  | ||
Текущая версия
Содержание | 
Аннотация
Рассматривается метод прогнозирования финансовых пузырей на основании информации, данной экспертом о наличии пузырей во временных рядах. Предлагается способ синтеза и отбора признаков, описывающих временной ряд. Алгоритм основан на разметке интервалов роста и падения временного ряда и применении логистической регрессии для настройки параметров линейной модели и оценки ее качества. Проведен вычислительный эксперимент на данных о ценах на сырье с 1995 по 2010 год.
Постановка задачи
Дана выборка  - временные ряды, размеченные экспертом. Для простоты будем считать, что длина всех рядов одинакова и равна 
.
Здесь целевая переменная 
, если в данном ряде есть пузырь, и 
 иначе. 
Предполагается, что временной ряд представляет из себя <<историю возникновения>> пузыря и сам пузырь (период раздувания и лопания). Период, который мы считаем историей, фиксируется экспертом или является параметром алгоритма.
Необходимо предложить признаковое описание временного ряда
На основании этого описания требуется решить задачу классификации --- построить модель
, где 
 - пространство параметров модели.
Задача разбивается на следующие этапы.
1. Порождение множества числовых признаков , описывающих временной ряд.
2. Предложение критерия качества модели.
3. Выбор наилучшей модели.
 
Пути решения задачи
Временной ряд - это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Множеством меток называется конечное множество . Множество меток задается экспертом. Пример множества меток: 
, где “
” -  метка для обозначения точек возрастания, “
” - убывания, “
” - метка для обозначения плато.
Фиксируем множество меток . Определим разбиение временного ряда на сегменты
: 
, 
при 
, 
. Разметкой временного ряда
 назовем пару 
: 
,
.
Основная рассматриваемая задача: разметка временного ряда и определение на её основании сходства временных рядов, синтез и выбор наиболее информативных признаков.
Предлагается использовать следующие признаки.
1. Бинарные признаки --- наличие в данном временном ряде определенной комбинации повышений и падений цены.
2. Действительный признаки --- суммарное изменение цены на этом интервале.
Предлагается использовать для построения классификатора логистическую регрессию, а для оценки качества модели - площадь под ROC-кривой. Настройка параметров логистической функции производится градиентными методами оптимизации. Для отбора наилучшей модели рассматривается генетический алгоритм.
Смотри также
|   |  Данная статья была создана в рамках учебного задания.
 
 См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 

