Задачи анализа данных в бизнес-аналитике (семинар К. В. Воронцова)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Текущая версия (17:32, 14 декабря 2010) (править) (отменить)
(Программа семинара)
 
(5 промежуточных версий не показаны.)
Строка 14: Строка 14:
* способствовать обмену опытом между настоящими и будущими профессионалами.
* способствовать обмену опытом между настоящими и будущими профессионалами.
-
Семинар ведёт д.ф.-м.н. [[Участник:Vokov|К.В.Воронцов]] ([[ММП|кафедра ММП]])
+
Семинар ведёт д.ф.-м.н. [[Участник:Vokov|К.В.Воронцов]] ([[ММП|кафедра Математических методов прогнозирования]])
{{well|
{{well|
-
Семинар проводится регулярно на факультете [[ВМК]] [[МГУ]] по пятницам в '''18:10''', аудитория '''П5''' (первый этаж).
+
Семинар проводится регулярно на факультете [[ВМК]] [[МГУ]] по пятницам в '''18:20''', аудитория '''П5''' (первый этаж).
'''Посещение семинара — свободное'''
'''Посещение семинара — свободное'''
Строка 42: Строка 42:
:Рассматривается классическая и новая технологии построения скоринговых карт. На семинаре рассказывается о том, как устроены данные о клиентах и о том, как породить наиболее правдоподобную скоринговую модель, отвечающую, к тому же, требованиям международных банковских стандартов.
:Рассматривается классическая и новая технологии построения скоринговых карт. На семинаре рассказывается о том, как устроены данные о клиентах и о том, как породить наиболее правдоподобную скоринговую модель, отвечающую, к тому же, требованиям международных банковских стандартов.
*[[Медиа:Strijov10scoring_slides_ru.pdf|Презентация (PDF, 582 Кб)]].
*[[Медиа:Strijov10scoring_slides_ru.pdf|Презентация (PDF, 582 Кб)]].
 +
*[[Медиа:Strijov10AHX_ru.pdf|Презентация АНХ (PDF, 3370 Кб)]].
|-
|-
| 24&nbsp;сентября&nbsp;2010<br>18:20
| 24&nbsp;сентября&nbsp;2010<br>18:20
Строка 62: Строка 63:
| '''''Федор Романенко''''', менеджер отдела качества поиска, Яндекс.
| '''''Федор Романенко''''', менеджер отдела качества поиска, Яндекс.
'''История и принципы ранжирования веб-поиска.'''
'''История и принципы ранжирования веб-поиска.'''
-
:Будут рассмотрены вопросы использования и развития методов Information Retrieval от текстового и ссылочного ранжирования до Machine Learning to Rank в задаче интернет поиска. Основные принципы, лежащие в основе современного веб-ранжирования, излагаются в привязке к историям успеха поисковых систем. Особое внимание уделяется влиянию качества поиска на рыночные показатели и жизненно важной необходимости постоянно работать над его улучшением.
+
:Рассматриваются вопросы использования и развития методов Information Retrieval, от текстового и ссылочного ранжирования до Machine Learning to Rank в задаче интернет-поиска. Основные принципы, лежащие в основе современного веб-ранжирования, излагаются в привязке к историям успеха поисковых систем. Особое внимание уделяется влиянию качества поиска на рыночные показатели и жизненно важной необходимости постоянно работать над его улучшением.
*[[Медиа:MSU-BI-Romanenko-2010-10-08.pdf|Презентация (PDF, 279&nbsp;Kб)]].
*[[Медиа:MSU-BI-Romanenko-2010-10-08.pdf|Презентация (PDF, 279&nbsp;Kб)]].
|-
|-
Строка 68: Строка 69:
| '''''Виталий Гольдштейн''''', разработчик, Яндекс.
| '''''Виталий Гольдштейн''''', разработчик, Яндекс.
'''Геоинформационные сервисы Яндекс.'''
'''Геоинформационные сервисы Яндекс.'''
-
:Будет рассказано о проекте Яндекс.Пробки и других геоинформационных проектах Яндекс, о том, откуда берутся исходные данные для построения геоинформационных систем, о новой масштабируемой технологии обработки данных, о конкурсе Интернет-математики и некоторых перспективных задачах. Будут предоставлены данные и дана формальная постановка задачи восстановления карты дорог.
+
:Рассказывается о проекте Яндекс.Пробки и других геоинформационных проектах Яндекс, о том, откуда берутся исходные данные для построения геоинформационных систем, о новой масштабируемой технологии обработки данных, о конкурсе Интернет-математики и некоторых перспективных задачах. Предоставляются данные и даётся формальная постановка задачи восстановления карты дорог.
*[[Медиа:MSU-BI-Goldshtein-2010-10-15.pdf|Презентация (PDF, 1,67&nbsp;Mб)]].
*[[Медиа:MSU-BI-Goldshtein-2010-10-15.pdf|Презентация (PDF, 1,67&nbsp;Mб)]].
*Страница прикладной задачи: [[Построение графа дорог по данным о треках транспортных средств (задача с данными)]].
*Страница прикладной задачи: [[Построение графа дорог по данным о треках транспортных средств (задача с данными)]].
*[[Обсуждение:Построение графа дорог по данным о треках транспортных средств (задача с данными)|Страница обсуждения]].
*[[Обсуждение:Построение графа дорог по данным о треках транспортных средств (задача с данными)|Страница обсуждения]].
|-
|-
-
| 22&nbsp;октября&nbsp;2010<br>18:20
+
| 22&nbsp;октября&nbsp;2010
| Семинар отменён.
| Семинар отменён.
|-
|-
Строка 79: Строка 80:
| '''''Федор Краснов''''', вице-президент по бизнес-процессам и информационным технологиям, АКАДО.
| '''''Федор Краснов''''', вице-президент по бизнес-процессам и информационным технологиям, АКАДО.
'''Как получать данные о клиентах?'''
'''Как получать данные о клиентах?'''
-
:Будут разбираться практические аспекты клиентской аналитики.
+
:Рассматриваются практические аспекты клиентской аналитики.
*[http://www.slideshare.net/fkrasnov Презентации Федора Краснова]: Клиентоориентированные KPI. Управление оттоком абонентов. Получение знаний о поведении абонентов.
*[http://www.slideshare.net/fkrasnov Презентации Федора Краснова]: Клиентоориентированные KPI. Управление оттоком абонентов. Получение знаний о поведении абонентов.
*[http://ru.linkedin.com/in/fkrasnov Федор Краснов в LinkedIn]
*[http://ru.linkedin.com/in/fkrasnov Федор Краснов в LinkedIn]
Строка 88: Строка 89:
'''Повышение рентабельности инвестиций маркетинга в телекоммуникациях с помощью аппарата математической статистики.'''
'''Повышение рентабельности инвестиций маркетинга в телекоммуникациях с помощью аппарата математической статистики.'''
:Большинство современных компаний работают на олигополистических рынках. В таких условиях на первое место выходит целевой маркетинг, который отвечает на вопросы «кого из клиентов развивать, а кого сохранять», «что предложить каждому сегменту клиентов» и «как максимально увеличить эффективность маркетинговых инвестиций» с помощью математического аппарата прогнозирования, сегментирования и описательной статистики.
:Большинство современных компаний работают на олигополистических рынках. В таких условиях на первое место выходит целевой маркетинг, который отвечает на вопросы «кого из клиентов развивать, а кого сохранять», «что предложить каждому сегменту клиентов» и «как максимально увеличить эффективность маркетинговых инвестиций» с помощью математического аппарата прогнозирования, сегментирования и описательной статистики.
 +
*[[Медиа:MSU-BI-Maslik-2010-11-12.pdf|Презентация (PDF, 1,4&nbsp;Mб)]].
 +
|-
 +
| 19&nbsp;ноября&nbsp;2010
 +
| Семинар отменён.
 +
|-
 +
| 26&nbsp;ноября&nbsp;2010<br>18:20
 +
| '''''Михаил Дайчик''''', менеджер технических программ Google.
 +
'''Университетские программы Google и некоторые повседневные задачи майнинга.'''
 +
:Рассказывается об университетских программах Google, в частности о выдаваемых грантах и ресурсах, к которым Google может предоставить доступ. Также рассматриваются некоторые прикладные задачи майнинга и машинного обучения, с которыми мы сталкивались в московском офисе Google.
 +
*[[Медиа:MSU-BI-Daichik-2010-10-26.pdf|Презентация (PDF, 160&nbsp;Kб)]].
 +
<!--
|-
|-
| ??&nbsp;??&nbsp;2010<br>18:20
| ??&nbsp;??&nbsp;2010<br>18:20
Строка 101: Строка 113:
| '''''Иван Гуз''''', IBM, SPSS.
| '''''Иван Гуз''''', IBM, SPSS.
'''Название формируется'''.
'''Название формируется'''.
 +
-->
|}
|}

Текущая версия

На семинаре студенты 3–5 курсов знакомятся с задачами интеллектуального анализа данных (Data Mininig) и машинного обучения (Machine Learning), возникающими в бизнес-аналитике (Business Intelligence).

В качестве докладчиков на семинар приглашаются молодые специалисты, делающие успешную карьеру аналитиков в высокотехнологичных компаниях, таких, как Microsoft, IBM, Google, Яндекс, МТС, и др. На каждом семинаре студентам рассказывают о некоторых бизнес-задачах, которые решаются в этих компаниях, о том, как происходит накопление данных, как возникают задачи анализа данных, какими методами их можно решать.

Как правило, к концу лекции докладчик ставит одну или несколько конкретных прикладных задач и предоставляет студентам набор специально подготовленных реальных данных. Студенты могут попробовать свои силы в решении этих задач и поучаствовать в конкурсе на лучшее решение, поскольку каждая задача имеет чётко заданный критерий качества. Некоторые задачи можно брать в качестве темы преддипломной практики, курсовой работы или даже дипломной работы (при согласовании с научным руководителем).

Все приглашаемые специалисты открыты для контактов, и студенты смогут обращаться к ним за консультациями.

Цели семинара:

  • способствовать устранению существующего разрыва между университетскими исследованиями и решением практических задач в области анализа данных;
  • способствовать обмену опытом между настоящими и будущими профессионалами.

Семинар ведёт д.ф.-м.н. К.В.Воронцов (кафедра Математических методов прогнозирования)


Семинар проводится регулярно на факультете ВМК МГУ по пятницам в 18:20, аудитория П5 (первый этаж).

Посещение семинара — свободное (если у Вас нет пропуска в МГУ, заранее сообщите вашу Ф.И.О. организаторам семинара для подачи списка участников на вахту).


Программа семинара

Дата Докладчик и тема семинара
10 сентября 2010
18:20
Александр Ефимов, руководитель аналитического отдела розничной сети МТС.

Прогнозирование эффекта маркетинговых кампаний и оптимизация ассортимента магазинов.

17 сентября 2010
18:20
Вадим Стрижов, научный сотрудник Вычислительного центра РАН.

Банковский кредитный скоринг: методы автоматического порождения и выбора моделей.

Рассматривается классическая и новая технологии построения скоринговых карт. На семинаре рассказывается о том, как устроены данные о клиентах и о том, как породить наиболее правдоподобную скоринговую модель, отвечающую, к тому же, требованиям международных банковских стандартов.
24 сентября 2010
18:20
Владимир Крекотень, начальник управления маркетинга и продаж брокерского дома «Открытие».

Применение математических методов для прогнозирования и противодействия оттоку клиентов.

Рассматриваются практические проблемы, возникающие при анализе клиентской базы в маркетинге. Ставятся задачи кластеризации и сегментации клиентов, скоринга новых клиентов, отслеживания динамики целевых сегментов.
1 октября 2010
18:20
Николай Филипенков, и.о. начальника отдела кредитного скоринга Банка Москвы.

Применение математических методов для управления розничным кредитным риском.

Рассматриваются некоторые практические аспекты построения скоринговых моделей и оценивания рисков.
8 октября 2010
18:20
Федор Романенко, менеджер отдела качества поиска, Яндекс.

История и принципы ранжирования веб-поиска.

Рассматриваются вопросы использования и развития методов Information Retrieval, от текстового и ссылочного ранжирования до Machine Learning to Rank в задаче интернет-поиска. Основные принципы, лежащие в основе современного веб-ранжирования, излагаются в привязке к историям успеха поисковых систем. Особое внимание уделяется влиянию качества поиска на рыночные показатели и жизненно важной необходимости постоянно работать над его улучшением.
15 октября 2010
18:20
Виталий Гольдштейн, разработчик, Яндекс.

Геоинформационные сервисы Яндекс.

Рассказывается о проекте Яндекс.Пробки и других геоинформационных проектах Яндекс, о том, откуда берутся исходные данные для построения геоинформационных систем, о новой масштабируемой технологии обработки данных, о конкурсе Интернет-математики и некоторых перспективных задачах. Предоставляются данные и даётся формальная постановка задачи восстановления карты дорог.
22 октября 2010 Семинар отменён.
29 октября 2010
18:20
Федор Краснов, вице-президент по бизнес-процессам и информационным технологиям, АКАДО.

Как получать данные о клиентах?

Рассматриваются практические аспекты клиентской аналитики.
12 ноября 2010
18:20
Владимир Маслик, старший эксперт по целевому маркетингу, компания Вымпелком.

Повышение рентабельности инвестиций маркетинга в телекоммуникациях с помощью аппарата математической статистики.

Большинство современных компаний работают на олигополистических рынках. В таких условиях на первое место выходит целевой маркетинг, который отвечает на вопросы «кого из клиентов развивать, а кого сохранять», «что предложить каждому сегменту клиентов» и «как максимально увеличить эффективность маркетинговых инвестиций» с помощью математического аппарата прогнозирования, сегментирования и описательной статистики.
19 ноября 2010 Семинар отменён.
26 ноября 2010
18:20
Михаил Дайчик, менеджер технических программ Google.

Университетские программы Google и некоторые повседневные задачи майнинга.

Рассказывается об университетских программах Google, в частности о выдаваемых грантах и ресурсах, к которым Google может предоставить доступ. Также рассматриваются некоторые прикладные задачи майнинга и машинного обучения, с которыми мы сталкивались в московском офисе Google.

См. также

Личные инструменты