Участник:Andyray/Курс по датамайнингу

Материал из MachineLearning.

< Участник:Andyray(Различия между версиями)
Перейти к: навигация, поиск
(Занятие 7)
Текущая версия (19:06, 23 декабря 2012) (править) (отменить)
м (О курсе)
 
(13 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
== Занятие 1 ==
+
== О курсе ==
-
О курсе. Что такое CRISP-DM? История создания (основатели, предпосылки).
+
Название курса: Практика и методология промышленного анализа данных
-
== Занятие 2 ==
+
Чем мы будем заниматься? Форма отчетности. Ученические проекты.
-
Введение в CRISP-DM. Подробное рассмотрение шагов методологии.
+
Что такое [[CRISP-DM]]? История создания (основатели, предпосылки). Основные шаги методологии.
-
== Занятие 3 ==
+
Предполагаемая форма занятий будет следующей. Группа разбивается на 2-3 подгруппы. Каждая подгруппа должна предоставить в конце семестра действующий проект. Проектом называется решение задачи из области анализа данных проведенное от постановки задачи и до внедрения.
-
Выбор задачи для самостоятельного проекта в течении семестра.
+
-
== Занятие 4 ==
+
== Введение в CRISP-DM ==
-
Понимание бизнеса (Business Understanding). Кейсы бизнес-проблем и их сведение к корректным постановкам задач анализа данных.
+
Подробное рассмотрение шагов методологии.
-
ОТП, НСС, Goods4Cast
+
-
== Занятие 5 ==
+
Результат: группа разделена на 3 части. Назначены координаторы группы. Выработана методика общения. Скайп-гуглдокс.
-
Понимание данных (Data Understanding).
+
-
== Занятие 6 ==
+
== Практика 1. Выбор задачи ==
-
Подготовка данных (Data Preparation). Находки при подготовке данных.
+
Выбор задачи для самостоятельного проекта в течении семестра. Для выбора задачи будет приглашено несколько экспертов, владельцев реальных задач из области анализа данных. Каждый из них выступает с рассказом о текущих проблемах его бизнеса. Студенты задают вопросы. Результатом данного собеседования должна стать концепция проекта для каждого из представителей бизнеса.
-
# НСС - создание системы шифрации признаков
+
После общего собеседования, можно провести частные собеседования по группам для того что бы дать возможность получить конкурентное преимущество задав более глубокие вопросы.
-
== Занятие 7 ==
+
== Понимание бизнеса ==
 +
Понимание бизнеса (Business Understanding). К этому моменту бизнес кейсы разобраны подгруппами внутри себя. У студентов готовы постановки задач и "коммерческие предложения" для бизнеса. Начинается работа по проекту. Для того что бы не напрягать внешних людей в компанию к каждому внешнему заказчику добавляется один внутренний эксперт из этой области (Каневский, Ивахненко, Татарчук, Лисица).
 +
 
 +
== Понимание данных ==
 +
Понимание данных (Data Understanding). К этому моменту должны быть готовы источники данных. Эти данные можно или сгенерировать или взять у представителей бизнеса. Данные развернуты на "боевых" машинах, каждой подгруппе предоставляется по одной виртуальной машине с данными. Студенты начинают разбираться в данных выявляя недочеты и строя общение с заказчиком для того что бы получить более хорошие данные.
 +
 
 +
== Подготовка данных ==
 +
Подготовка данных (Data Preparation). Находки при подготовке данных. К этому моменту студенты подготавливают данные к использованию. Данные прошли очистку, предварительную обработку, предварительный анализ.
 +
 
 +
== Практика 2. Обсуждение текущих дел в проектах ==
 +
Промежуточное подведение итогов по поставленным задачам. Отчет студентов.
 +
 
 +
== Моделирование ==
Моделирование (Modeling). Проблемы подбора моделей. Как быстро выбрать модель. Что делать если модель не подошла?
Моделирование (Modeling). Проблемы подбора моделей. Как быстро выбрать модель. Что делать если модель не подошла?
-
== Занятие 8 ==
+
== Оценка ==
 +
Оценка (Evaluation)
 +
 
 +
== Развертывание ==
 +
Развертывание (Deployment)
 +
 
 +
== Практика 3. Отчет о текущем положении дел ==
 +
Второе промежуточное занятие. Отчет о текущем положении дел. Обсуждение задач и возникших проблем.
-
== Занятие 9 ==
+
== Защита проектов 1 ==
 +
Защита проектов 1.
-
== Занятие 10 ==
+
== Защита проектов 2 ==
 +
Защита проектов 2.

Текущая версия

Содержание

О курсе

Название курса: Практика и методология промышленного анализа данных

Чем мы будем заниматься? Форма отчетности. Ученические проекты. Что такое CRISP-DM? История создания (основатели, предпосылки). Основные шаги методологии.

Предполагаемая форма занятий будет следующей. Группа разбивается на 2-3 подгруппы. Каждая подгруппа должна предоставить в конце семестра действующий проект. Проектом называется решение задачи из области анализа данных проведенное от постановки задачи и до внедрения.

Введение в CRISP-DM

Подробное рассмотрение шагов методологии.

Результат: группа разделена на 3 части. Назначены координаторы группы. Выработана методика общения. Скайп-гуглдокс.

Практика 1. Выбор задачи

Выбор задачи для самостоятельного проекта в течении семестра. Для выбора задачи будет приглашено несколько экспертов, владельцев реальных задач из области анализа данных. Каждый из них выступает с рассказом о текущих проблемах его бизнеса. Студенты задают вопросы. Результатом данного собеседования должна стать концепция проекта для каждого из представителей бизнеса.

После общего собеседования, можно провести частные собеседования по группам для того что бы дать возможность получить конкурентное преимущество задав более глубокие вопросы.

Понимание бизнеса

Понимание бизнеса (Business Understanding). К этому моменту бизнес кейсы разобраны подгруппами внутри себя. У студентов готовы постановки задач и "коммерческие предложения" для бизнеса. Начинается работа по проекту. Для того что бы не напрягать внешних людей в компанию к каждому внешнему заказчику добавляется один внутренний эксперт из этой области (Каневский, Ивахненко, Татарчук, Лисица).

Понимание данных

Понимание данных (Data Understanding). К этому моменту должны быть готовы источники данных. Эти данные можно или сгенерировать или взять у представителей бизнеса. Данные развернуты на "боевых" машинах, каждой подгруппе предоставляется по одной виртуальной машине с данными. Студенты начинают разбираться в данных выявляя недочеты и строя общение с заказчиком для того что бы получить более хорошие данные.

Подготовка данных

Подготовка данных (Data Preparation). Находки при подготовке данных. К этому моменту студенты подготавливают данные к использованию. Данные прошли очистку, предварительную обработку, предварительный анализ.

Практика 2. Обсуждение текущих дел в проектах

Промежуточное подведение итогов по поставленным задачам. Отчет студентов.

Моделирование

Моделирование (Modeling). Проблемы подбора моделей. Как быстро выбрать модель. Что делать если модель не подошла?

Оценка

Оценка (Evaluation)

Развертывание

Развертывание (Deployment)

Практика 3. Отчет о текущем положении дел

Второе промежуточное занятие. Отчет о текущем положении дел. Обсуждение задач и возникших проблем.

Защита проектов 1

Защита проектов 1.

Защита проектов 2

Защита проектов 2.