Задачи анализа данных в бизнес-аналитике (семинар К. В. Воронцова)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Цели семинара)
Текущая версия (17:32, 14 декабря 2010) (править) (отменить)
(Программа семинара)
 
(27 промежуточных версий не показаны.)
Строка 4: Строка 4:
На каждом семинаре студентам рассказывают о некоторых бизнес-задачах, которые решаются в этих компаниях, о том, как происходит накопление данных, как возникают задачи анализа данных, какими методами их можно решать.
На каждом семинаре студентам рассказывают о некоторых бизнес-задачах, которые решаются в этих компаниях, о том, как происходит накопление данных, как возникают задачи анализа данных, какими методами их можно решать.
-
Как правило, к концу лекции докладчик ставит одну или несколько конкретных задач и предоставляет студентам набор специально подготовленных реальных данных.
+
Как правило, к концу лекции докладчик ставит одну или несколько конкретных [[:Категория:Прикладные исследования|прикладных задач]] и предоставляет студентам набор специально подготовленных реальных данных.
-
Студенты могут попробовать свои силы в решении этих задач и поучаствовать в конкурсе на лучшее решение, поскольку каждая задача имеет чётко заданный критерий качества.
+
Студенты могут попробовать свои силы в решении этих задач и поучаствовать в [[:Категория:Конкурсы|конкурсе]] на лучшее решение, поскольку каждая задача имеет чётко заданный [[критерий качества]].
Некоторые задачи можно брать в качестве темы преддипломной практики, курсовой работы или даже дипломной работы (при согласовании с научным руководителем).
Некоторые задачи можно брать в качестве темы преддипломной практики, курсовой работы или даже дипломной работы (при согласовании с научным руководителем).
Все приглашаемые специалисты открыты для контактов, и студенты смогут обращаться к ним за консультациями.
Все приглашаемые специалисты открыты для контактов, и студенты смогут обращаться к ним за консультациями.
-
:
+
'''Цели семинара''':
* способствовать устранению существующего разрыва между университетскими исследованиями и решением практических задач в области анализа данных;
* способствовать устранению существующего разрыва между университетскими исследованиями и решением практических задач в области анализа данных;
* способствовать обмену опытом между настоящими и будущими профессионалами.
* способствовать обмену опытом между настоящими и будущими профессионалами.
-
Семинар ведёт д.ф.-м.н. [[Участник:Vokov|К.В.Воронцов]] ([[ММП|кафедра ММП]])
+
Семинар ведёт д.ф.-м.н. [[Участник:Vokov|К.В.Воронцов]] ([[ММП|кафедра Математических методов прогнозирования]])
{{well|
{{well|
-
Семинар проводится регулярно на факультете [[ВМК]] [[МГУ]] по пятницам в '''18:10''', аудитория '''П5''' (первый этаж).
+
Семинар проводится регулярно на факультете [[ВМК]] [[МГУ]] по пятницам в '''18:20''', аудитория '''П5''' (первый этаж).
'''Посещение семинара — свободное'''
'''Посещение семинара — свободное'''
Строка 30: Строка 30:
! width="90%" | Докладчик и тема семинара
! width="90%" | Докладчик и тема семинара
|-
|-
-
| 10&nbsp;сентября&nbsp;2010<br>18:10
+
| 10&nbsp;сентября&nbsp;2010<br>18:20
-
| ''Александр Ефимов'',<br>руководитель аналитического отдела розничной сети МТС.
+
| '''''Александр Ефимов''''', руководитель аналитического отдела розничной сети МТС.
-
'''Прогнозирование эффекта маркетинговых кампаний и оптимизация ассортимента магазинов.'''
+
'''Прогнозирование эффекта маркетинговых кампаний и оптимизация ассортимента магазинов'''.
 +
*[[Медиа:MSU-BI-Efimov-2010-09-10.pdf|Презентация (PDF, 520&nbsp;Кб)]].
 +
*Страница прикладной задачи: [[Оптимизация ассортимента торговых точек (задача с данными)]].
 +
*[[Обсуждение:Оптимизация ассортимента торговых точек (задача с данными)|Страница обсуждения]].
|-
|-
-
| 17&nbsp;сентября&nbsp;2010<br>18:10
+
| 17&nbsp;сентября&nbsp;2010<br>18:20
-
| ''Даниил Гусев'',<br>менеджер по инновационному развитию банка ВТБ24.
+
| '''''Вадим Стрижов''''', научный сотрудник Вычислительного центра РАН.
-
'''Особенности внедрения инноваций в розничном банке.'''
+
'''Банковский кредитный скоринг: методы автоматического порождения и выбора моделей'''.
-
:Будут разобраны кейсы из опыта ведущих российский и западных розничных банков. Отдельное внимание будет уделено сценарному прогнозированию с использованием математических моделей.
+
:Рассматривается классическая и новая технологии построения скоринговых карт. На семинаре рассказывается о том, как устроены данные о клиентах и о том, как породить наиболее правдоподобную скоринговую модель, отвечающую, к тому же, требованиям международных банковских стандартов.
 +
*[[Медиа:Strijov10scoring_slides_ru.pdf|Презентация (PDF, 582&nbsp;Кб)]].
 +
*[[Медиа:Strijov10AHX_ru.pdf|Презентация АНХ (PDF, 3370&nbsp;Кб)]].
|-
|-
-
| 24&nbsp;сентября&nbsp;2010<br>18:10
+
| 24&nbsp;сентября&nbsp;2010<br>18:20
-
| ''Владимир Крекотень'',<br>начальник управления маркетинга и продаж брокерского дома «Открытие».
+
| '''''Владимир Крекотень''''', начальник управления маркетинга и продаж брокерского дома «Открытие».
-
'''Применение математических методов для прогнозирования и противодействия оттоку клиентов.'''
+
'''Применение математических методов для прогнозирования и противодействия оттоку клиентов'''.
-
:Будут обсуждаться практические проблемы, возникшие при решении этой задачи и использованные методы.
+
:Рассматриваются практические проблемы, возникающие при анализе клиентской базы в маркетинге. Ставятся задачи кластеризации и сегментации клиентов, скоринга новых клиентов, отслеживания динамики целевых сегментов.
 +
*[[Медиа:MSU-BI-Krekoten-2010-09-24.pdf|Презентация (PDF, 320&nbsp;Кб)]].
 +
*Страница прикладной задачи: [[Кластеризация клиентов брокерской компании (задача с данными)]].
 +
*[[Обсуждение:Кластеризация клиентов брокерской компании (задача с данными)|Страница обсуждения]].
 +
|-
 +
| 1&nbsp;октября&nbsp;2010<br>18:20
 +
| '''''Николай Филипенков''''', и.о. начальника отдела кредитного скоринга Банка Москвы.
 +
'''Применение математических методов для управления розничным кредитным риском'''.
 +
:Рассматриваются некоторые практические аспекты построения скоринговых моделей и оценивания рисков.
 +
*[[Медиа:MSU-BI-Filipenkov-2010-10-01.pdf|Презентация (PDF, 1.1&nbsp;Mб)]].
 +
*Страница прикладной задачи: [[Управление розничным кредитным риском (задача с данными)]].
 +
*[[Обсуждение:Управление розничным кредитным риском (задача с данными)|Страница обсуждения]].
 +
|-
 +
| 8&nbsp;октября&nbsp;2010<br>18:20
 +
| '''''Федор Романенко''''', менеджер отдела качества поиска, Яндекс.
 +
'''История и принципы ранжирования веб-поиска.'''
 +
:Рассматриваются вопросы использования и развития методов Information Retrieval, от текстового и ссылочного ранжирования до Machine Learning to Rank в задаче интернет-поиска. Основные принципы, лежащие в основе современного веб-ранжирования, излагаются в привязке к историям успеха поисковых систем. Особое внимание уделяется влиянию качества поиска на рыночные показатели и жизненно важной необходимости постоянно работать над его улучшением.
 +
*[[Медиа:MSU-BI-Romanenko-2010-10-08.pdf|Презентация (PDF, 279&nbsp;Kб)]].
 +
|-
 +
| 15&nbsp;октября&nbsp;2010<br>18:20
 +
| '''''Виталий Гольдштейн''''', разработчик, Яндекс.
 +
'''Геоинформационные сервисы Яндекс.'''
 +
:Рассказывается о проекте Яндекс.Пробки и других геоинформационных проектах Яндекс, о том, откуда берутся исходные данные для построения геоинформационных систем, о новой масштабируемой технологии обработки данных, о конкурсе Интернет-математики и некоторых перспективных задачах. Предоставляются данные и даётся формальная постановка задачи восстановления карты дорог.
 +
*[[Медиа:MSU-BI-Goldshtein-2010-10-15.pdf|Презентация (PDF, 1,67&nbsp;Mб)]].
 +
*Страница прикладной задачи: [[Построение графа дорог по данным о треках транспортных средств (задача с данными)]].
 +
*[[Обсуждение:Построение графа дорог по данным о треках транспортных средств (задача с данными)|Страница обсуждения]].
 +
|-
 +
| 22&nbsp;октября&nbsp;2010
 +
| Семинар отменён.
 +
|-
 +
| 29&nbsp;октября&nbsp;2010<br>18:20
 +
| '''''Федор Краснов''''', вице-президент по бизнес-процессам и информационным технологиям, АКАДО.
 +
'''Как получать данные о клиентах?'''
 +
:Рассматриваются практические аспекты клиентской аналитики.
 +
*[http://www.slideshare.net/fkrasnov Презентации Федора Краснова]: Клиентоориентированные KPI. Управление оттоком абонентов. Получение знаний о поведении абонентов.
 +
*[http://ru.linkedin.com/in/fkrasnov Федор Краснов в LinkedIn]
 +
*[http://blog.easykpi.ru/ Блог Федора Краснова]
 +
|-
 +
| 12&nbsp;ноября&nbsp;2010<br>18:20
 +
| '''''Владимир Маслик''''', старший эксперт по целевому маркетингу, компания Вымпелком.
 +
'''Повышение рентабельности инвестиций маркетинга в телекоммуникациях с помощью аппарата математической статистики.'''
 +
:Большинство современных компаний работают на олигополистических рынках. В таких условиях на первое место выходит целевой маркетинг, который отвечает на вопросы «кого из клиентов развивать, а кого сохранять», «что предложить каждому сегменту клиентов» и «как максимально увеличить эффективность маркетинговых инвестиций» с помощью математического аппарата прогнозирования, сегментирования и описательной статистики.
 +
*[[Медиа:MSU-BI-Maslik-2010-11-12.pdf|Презентация (PDF, 1,4&nbsp;Mб)]].
 +
|-
 +
| 19&nbsp;ноября&nbsp;2010
 +
| Семинар отменён.
 +
|-
 +
| 26&nbsp;ноября&nbsp;2010<br>18:20
 +
| '''''Михаил Дайчик''''', менеджер технических программ Google.
 +
'''Университетские программы Google и некоторые повседневные задачи майнинга.'''
 +
:Рассказывается об университетских программах Google, в частности о выдаваемых грантах и ресурсах, к которым Google может предоставить доступ. Также рассматриваются некоторые прикладные задачи майнинга и машинного обучения, с которыми мы сталкивались в московском офисе Google.
 +
*[[Медиа:MSU-BI-Daichik-2010-10-26.pdf|Презентация (PDF, 160&nbsp;Kб)]].
 +
<!--
 +
|-
 +
| ??&nbsp;??&nbsp;2010<br>18:20
 +
| '''''Даниил Гусев''''', менеджер по инновационному развитию банка ВТБ24.
 +
'''Особенности внедрения инноваций в розничном банке.'''
 +
:Будут разобраны кейсы из опыта ведущих российских и западных розничных банков. Отдельное внимание будет уделено сценарному прогнозированию с использованием математических моделей.
|-
|-
-
| ??&nbsp;??&nbsp;2010<br>18:10
+
| ??&nbsp;??&nbsp;2010<br>18:20
-
| ''Михаил Романов'', Связной.<br>'''Название формируется'''
+
| '''''Михаил Романов''''', Связной.
 +
'''Название формируется'''.
|-
|-
-
| ??&nbsp;??&nbsp;2010<br>18:10
+
| ??&nbsp;??&nbsp;2010<br>18:20
-
| ''Иван Гуз'', IBM, SPSS.<br>'''Название формируется'''
+
| '''''Иван Гуз''''', IBM, SPSS.
 +
'''Название формируется'''.
 +
-->
|}
|}

Текущая версия

На семинаре студенты 3–5 курсов знакомятся с задачами интеллектуального анализа данных (Data Mininig) и машинного обучения (Machine Learning), возникающими в бизнес-аналитике (Business Intelligence).

В качестве докладчиков на семинар приглашаются молодые специалисты, делающие успешную карьеру аналитиков в высокотехнологичных компаниях, таких, как Microsoft, IBM, Google, Яндекс, МТС, и др. На каждом семинаре студентам рассказывают о некоторых бизнес-задачах, которые решаются в этих компаниях, о том, как происходит накопление данных, как возникают задачи анализа данных, какими методами их можно решать.

Как правило, к концу лекции докладчик ставит одну или несколько конкретных прикладных задач и предоставляет студентам набор специально подготовленных реальных данных. Студенты могут попробовать свои силы в решении этих задач и поучаствовать в конкурсе на лучшее решение, поскольку каждая задача имеет чётко заданный критерий качества. Некоторые задачи можно брать в качестве темы преддипломной практики, курсовой работы или даже дипломной работы (при согласовании с научным руководителем).

Все приглашаемые специалисты открыты для контактов, и студенты смогут обращаться к ним за консультациями.

Цели семинара:

  • способствовать устранению существующего разрыва между университетскими исследованиями и решением практических задач в области анализа данных;
  • способствовать обмену опытом между настоящими и будущими профессионалами.

Семинар ведёт д.ф.-м.н. К.В.Воронцов (кафедра Математических методов прогнозирования)


Семинар проводится регулярно на факультете ВМК МГУ по пятницам в 18:20, аудитория П5 (первый этаж).

Посещение семинара — свободное (если у Вас нет пропуска в МГУ, заранее сообщите вашу Ф.И.О. организаторам семинара для подачи списка участников на вахту).


Программа семинара

Дата Докладчик и тема семинара
10 сентября 2010
18:20
Александр Ефимов, руководитель аналитического отдела розничной сети МТС.

Прогнозирование эффекта маркетинговых кампаний и оптимизация ассортимента магазинов.

17 сентября 2010
18:20
Вадим Стрижов, научный сотрудник Вычислительного центра РАН.

Банковский кредитный скоринг: методы автоматического порождения и выбора моделей.

Рассматривается классическая и новая технологии построения скоринговых карт. На семинаре рассказывается о том, как устроены данные о клиентах и о том, как породить наиболее правдоподобную скоринговую модель, отвечающую, к тому же, требованиям международных банковских стандартов.
24 сентября 2010
18:20
Владимир Крекотень, начальник управления маркетинга и продаж брокерского дома «Открытие».

Применение математических методов для прогнозирования и противодействия оттоку клиентов.

Рассматриваются практические проблемы, возникающие при анализе клиентской базы в маркетинге. Ставятся задачи кластеризации и сегментации клиентов, скоринга новых клиентов, отслеживания динамики целевых сегментов.
1 октября 2010
18:20
Николай Филипенков, и.о. начальника отдела кредитного скоринга Банка Москвы.

Применение математических методов для управления розничным кредитным риском.

Рассматриваются некоторые практические аспекты построения скоринговых моделей и оценивания рисков.
8 октября 2010
18:20
Федор Романенко, менеджер отдела качества поиска, Яндекс.

История и принципы ранжирования веб-поиска.

Рассматриваются вопросы использования и развития методов Information Retrieval, от текстового и ссылочного ранжирования до Machine Learning to Rank в задаче интернет-поиска. Основные принципы, лежащие в основе современного веб-ранжирования, излагаются в привязке к историям успеха поисковых систем. Особое внимание уделяется влиянию качества поиска на рыночные показатели и жизненно важной необходимости постоянно работать над его улучшением.
15 октября 2010
18:20
Виталий Гольдштейн, разработчик, Яндекс.

Геоинформационные сервисы Яндекс.

Рассказывается о проекте Яндекс.Пробки и других геоинформационных проектах Яндекс, о том, откуда берутся исходные данные для построения геоинформационных систем, о новой масштабируемой технологии обработки данных, о конкурсе Интернет-математики и некоторых перспективных задачах. Предоставляются данные и даётся формальная постановка задачи восстановления карты дорог.
22 октября 2010 Семинар отменён.
29 октября 2010
18:20
Федор Краснов, вице-президент по бизнес-процессам и информационным технологиям, АКАДО.

Как получать данные о клиентах?

Рассматриваются практические аспекты клиентской аналитики.
12 ноября 2010
18:20
Владимир Маслик, старший эксперт по целевому маркетингу, компания Вымпелком.

Повышение рентабельности инвестиций маркетинга в телекоммуникациях с помощью аппарата математической статистики.

Большинство современных компаний работают на олигополистических рынках. В таких условиях на первое место выходит целевой маркетинг, который отвечает на вопросы «кого из клиентов развивать, а кого сохранять», «что предложить каждому сегменту клиентов» и «как максимально увеличить эффективность маркетинговых инвестиций» с помощью математического аппарата прогнозирования, сегментирования и описательной статистики.
19 ноября 2010 Семинар отменён.
26 ноября 2010
18:20
Михаил Дайчик, менеджер технических программ Google.

Университетские программы Google и некоторые повседневные задачи майнинга.

Рассказывается об университетских программах Google, в частности о выдаваемых грантах и ресурсах, к которым Google может предоставить доступ. Также рассматриваются некоторые прикладные задачи майнинга и машинного обучения, с которыми мы сталкивались в московском офисе Google.

См. также

Личные инструменты