Прогнозирование объемов грузовых железнодорожных перевозок

Материал из MachineLearning.

Перейти к: навигация, поиск

Страница посвящена описанию проекта по разработке и исследованию свойств системы прогнозирования объемов грузовых железнодорожных перевозок с учетом экзогенных факторов.

Содержание

Цели и задачи проекта

Проект направлен на решение задачи повышения эффективности бизнес-процессов индустриального партнера — ОАО «РЖД». Целью проекта является разработка и адаптация математических методов и алгоритмов прогнозирования с учетом специфики задач, решаемых в интересах ОАО «РЖД», и создание системы прогнозирования на их основе. Применение разработанных методов и алгоритмов, проектирование и внедрение подсистемы прогнозирования, позволят повысить обоснованность, объективность и эффективность принятия решений в бизнес-процессах, связанных с заключением контрактов и планированием грузовых железнодорожных перевозок.

  • Статьи, посвященные описанию системы: [1], [2]
  • Запускаемые модели прогнозирования, генерации тестовых данных и тестирования системы [code].
  • Функциональные диаграммы системы прогнозирования и генерации тестовых данных: [IDEF].

Компоненты системы

Задача прогнозирования спроса на грузовые перевозки была поставлена для оперативного планирования перевозок по историческим данным с временным интервалом от суток до года. Для решения задачи необходимо решить ряд подзадач, связанных со спецификой прикладной области.

Исследования по разработке модели прогнозирования

Предложен алгоритм hist непараметрического прогнозирования загруженности железнодорожных узлов РЖД по историческим данным. Алгоритм основан на свертке эмпирической плотности распределения значений временного ряда с функцией потерь. Исследованы свойства алгоритма при гистограммной и ядерной оценке плотности распределения нестационарного временного ряда.

  • Вальков А.С., Кожанов Е.М., Медведникова М.М., Хусаинов Ф.И. Непараметрическое прогнозирование загруженности системы железнодорожных узлов по историческим данным // Машинное обучение и анализ данных. 2012. T. 1, № 4. C. 448-465
  • Ссылка на код.
  • Описание экспериментов по исследованию свойств алгоритма hist: [Stenina2014HistProperties].
  • Комбинация hist+ARIMA: Stenina2015ArimaHistForecast.pdf.
  • Несмещенная комбинация MK: superposition.pdf

Учет влияния экзогенных факторов

В качестве методов выявления связи между временными рядами рассмотрены тест Грейнджера и метод сходящегося перекрестного отображения. Исследованы экономические факторы, связанные с объектами перевозок: цены на нефть и нефтепродукты, газ, металлы, сахар.

  • Публикации: Вальков А.С., Кожанов Е.М., Мотренко А.П., Хусаинов Ф.И. Построение кросс-корреляционных зависимостей при прогнозе загруженности железнодорожного узла // Машинное обучение и анализ данных. 2013. № 5. С.503-517. Код и текст статьи в папке [3]
  • Мотренко А.П. Использование теста Грейнджера при прогнозировании временных рядов // Машинное обучение и анализ данных. 2011. № 1. С. 51-60. Материалы.

Для учета экзогенных факторов в модели гистограммного прогнозирования предлагается уточнить гистограмму прогнозируемого (эндогенного) временного ряда, используя информацию о реализации значений экзогенных временных рядов. Рассматриваются методы уточнения гистограммы: условные гистограммы, смеси гистограмм.

Прогноз с учетом топологии

Предлагается повысить качество прогноза за счет учета топологии сети: выполняется прогнозирование отправлений по парам станций вместо прогнозирования отправления всех вагонов с заданной станции. Поставлен вычислительный эксперимент, который подтвердил предположение о том, что прогноз по парам станций точнее, чем прогноз суммарного количества отправленных с заданной станции вагонов.

  • Газизуллина Р.К., Стенина М.М., Стрижов В.В. Прогнозирование объемов железнодорожных грузоперевозок по парам веток // Системы и средства информатики. — 2015, 25(1) — 144-157.
  • Ссылки на код и текст статьи.

Согласование прогнозов

  • Стенина М., Стрижов В. Согласование агрегированных и детализированных прогнозов при решении задач непараметрического прогнозирования // Системы и средства информатики, 2014, 24(2) — 21-34.
  • Мотренко А.П., Стрижов В.В. Построение агрегированных прогнозов объемов железнодорожных грузоперевозок c использованием расстояния Кульбака-Лейблера // Информатика и ее применения, 2014, 8(2) — 86-97.
  • Стенина М.М., Стрижов В.В. Согласование прогнозов при решении задач прогнозирования иерархических временных рядов // Информатика и ее применения, 2015


Анализ и сравнение моделей прогнозирования

  • Визуальный отчет о тестировании системы (набор рисунков и таблиц, MK), report.pdf
  • Заметки об оценке длины предыстории ряда Medvednikova2014RailRoads.pdf.
  • Подход Ю.Н. Орлова к анализу нестационарных временных рядов, описание SampleSizeTS.pdf