Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Результаты)
Строка 7: Строка 7:
# эксплуатационная документация в формате systemdoics,
# эксплуатационная документация в формате systemdoics,
# код вычислительного эксперимента и тесты,
# код вычислительного эксперимента и тесты,
-
# версия кода для эксплуатаци[mvr.jmlda.org],
+
# версия кода для эксплуатаци[http://mvr.jmlda.org],
# доклады и презентация.
# доклады и презентация.
-
 
+
'''Результаты предыдущих курсов'''
 +
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, весна 2014 | Группа 174, весна 2014: первая научная статья]]
 +
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013 | Группа 074, осень 2013: вычислительный эксперимент]]
== Результаты ==
== Результаты ==
Строка 188: Строка 190:
|}
|}
-
==
+
== Расписание (до начала курса будет уточняться) ==
 +
{|class="wikitable"
 +
! Дата
 +
!
 +
! Что сделано
 +
! Результат для обсуждения
 +
! Буква
 +
|-
 +
|Сентябрь
 +
|3
 +
|Представление нового курса, мотивация, организация работ. Две вводные лекции для новых студентов (по возможности).
 +
|Обсудим прошлый семестр.
 +
|
 +
|-
 +
|
 +
|10
 +
|Выбрана задача, рецензент. Доклад на 45 секунд о своем проекте.
 +
|Запись в ML.
 +
|
 +
|-
 +
|
 +
|17
 +
|Собрана литература, написаны комментарии.
 +
|Список литературы и мини-сообщение.
 +
|Literatura
 +
|-
 +
|
 +
|24
 +
|Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX.
 +
|Примерно страница текста.
 +
|Statement
 +
|-
 +
|Октябрь
 +
|1
 +
|Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные).
 +
|Описание, IDEF0.
 +
|Idef
 +
|-
 +
|8
 +
|
 +
|Детализирован интерфейс, написан код первого приближения.
 +
|Код для синтетических данных.
 +
|Code
 +
|-
 +
|
 +
|15
 +
|Написаны юнит-тесты и модуль, их запускающий.
 +
|Юнит-тесты.
 +
|Unit-test
 +
|-
 +
|
 +
|22
 +
|Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных.
 +
|Данные, вторая схема IDEF0, модули.
 +
|Data
 +
|-
 +
|
 +
|29
 +
|Написаны и запущены системные тесты. По результатам доработки кода написана рецензия на работу.
 +
|Тесты, рецензия.
 +
|Tests
 +
|-
 +
|Ноябрь
 +
|5
 +
|Код оптимизирован.
 +
|Отчет профайлера до и после.
 +
|Profiler
 +
|-
 +
|
 +
|12
 +
|Сделан визуальный отчет.
 +
|Завершенный тех.отчет.
 +
|Report
 +
|-
 +
|
 +
|19
 +
|Разработан веб-интерфейс.
 +
|Код на сайте.
 +
|Web
 +
|-
 +
|
 +
|26
 +
|Сделан пользовательский интерфейс и неколько примеров использования системы.
 +
|Обсуждение результатов, доклад первой группы.
 +
|Show
 +
|-
 +
|Декабрь
 +
|3
 +
|Подготовлен доклад, приведены в порядок документация и код.
 +
|Доклад второй группы.
 +
|Show
 +
|-
 +
 
 +
 
 +
|}
 +
 
 +
 
 +
== Черновик описания курса ==
'''Анализ свойств''' включает следующие основные элементы:
'''Анализ свойств''' включает следующие основные элементы:
Строка 199: Строка 298:
'''Результат''':
'''Результат''':
-
* модуль для построения модели (на языке Matlab),
+
* модуль для построения модели на языке Матлаб,
* юнит-тесты модуля,
* юнит-тесты модуля,
* вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
* вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
Строка 218: Строка 317:
* Модуль на сервере mvr.jmlda.org.
* Модуль на сервере mvr.jmlda.org.
-
'''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. <!---Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.--->
+
'''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. Так как на третьем курсе мы подали ряд статей в журналы ВАК, то имеет смысл для некоторых работ обсудить формат статьи в журнал WebOfKnowledge.<!---Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.--->
-
'''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на Matlab'е.
+
'''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на Матлабе.
== Мотивация ==
== Мотивация ==
-
 
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом:
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом:
1) ставим задачу в формальном наиболее детализированном варианте,
1) ставим задачу в формальном наиболее детализированном варианте,
2) делаем вычислительные эксперименты на Матлабе,
2) делаем вычислительные эксперименты на Матлабе,
3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.
3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.
-
 
-
Мы будем использовать тот инструмент, который позволит одну строку отчета или научной статьи представить в виде одной строки кода. Сейчас есть один такой инструмент - Matlab. <!--- Возможно, таковым станет Mathematica для сложных постановок задач машинного обучения и анализа данных. --->
 
== Сделать ==
== Сделать ==

Версия 12:36, 26 августа 2014


Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы Результаты, Расписание, Постановка задач. --Strijov 02:09, 15 мая 2014 (MSD)


Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации. Cоздаются эксплуатационные интерфейсы. Результатами работы являются:

  1. эксплуатационная документация в формате systemdoics,
  2. код вычислительного эксперимента и тесты,
  3. версия кода для эксплуатаци[1],
  4. доклады и презентация.

Результаты предыдущих курсов

Результаты

Автор Тема научной работы Ссылка Консультант Доклады Буквы Сумма Оценка
Газизуллина Римма Про [2], pdf
Гринчук Алексей Выб [3], pdf
Гущин Александр Пос [4], pdf
Ефимова Ирина Диф [5], pdf
Жуков Андрей Пос [6], pdf
Игнатов Андрей Обу [7], pdf
Карасиков Михаил Пои [8], pdf
Кулунчаков Андрей Обн [9], pdf
Липатова Анна Обн [10], pdf
Макарова Анастасия Исп [11], pdf
Плавин Александр Опт [12], pdf И.О. Консультанта
Попова Мария Выб [13], pdf
Швец Михаил Инт [14], pdf
Шинкевич Михаил Вли [15], pdf
Sk Что
Sk Что
ВШЭ Что
ВШЭ Что

Расписание (до начала курса будет уточняться)

Дата Что сделано Результат для обсуждения Буква
Сентябрь 3 Представление нового курса, мотивация, организация работ. Две вводные лекции для новых студентов (по возможности). Обсудим прошлый семестр.
10 Выбрана задача, рецензент. Доклад на 45 секунд о своем проекте. Запись в ML.
17 Собрана литература, написаны комментарии. Список литературы и мини-сообщение. Literatura
24 Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. Примерно страница текста. Statement
Октябрь 1 Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). Описание, IDEF0. Idef
8 Детализирован интерфейс, написан код первого приближения. Код для синтетических данных. Code
15 Написаны юнит-тесты и модуль, их запускающий. Юнит-тесты. Unit-test
22 Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. Данные, вторая схема IDEF0, модули. Data
29 Написаны и запущены системные тесты. По результатам доработки кода написана рецензия на работу. Тесты, рецензия. Tests
Ноябрь 5 Код оптимизирован. Отчет профайлера до и после. Profiler
12 Сделан визуальный отчет. Завершенный тех.отчет. Report
19 Разработан веб-интерфейс. Код на сайте. Web
26 Сделан пользовательский интерфейс и неколько примеров использования системы. Обсуждение результатов, доклад первой группы. Show
Декабрь 3 Подготовлен доклад, приведены в порядок документация и код. Доклад второй группы. Show


Черновик описания курса

Анализ свойств включает следующие основные элементы:

  • тестирование постановки задачи и принятых (статистических) гипотез порождения данных
  • анализ ошибки или анализ регрессионных остатков,
  • анализ адекватности модели,
  • анализ условий применимости модели,
  • анализ сложности модели,
  • анализ вычислительной сложности алгоритмов построения или эксплуатации модели.

Результат:

  • модуль для построения модели на языке Матлаб,
  • юнит-тесты модуля,
  • вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
  • модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
  • юнит-тесты эксплуатируемой части,
  • конструкторская документация в формате Systemdocs, в частности:
    • мотивация проекта,
    • формальная постановка задачи,
    • IDEF модуля построения модели,
    • IDEF модуля эксплуатации модели (если требуется),
    • описание интерфейсов,
    • описание системных тестов и их результатов,
    • описание юнит-тестов,
    • анализ производительности.

Эксплуатация модели предполагается в одном из вариантов, доступных для широкого круга пользователей:

  • Модуль на Google Play / Apple Store,
  • Модуль на сервере mvr.jmlda.org.

Научная статья: написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. Так как на третьем курсе мы подали ряд статей в журналы ВАК, то имеет смысл для некоторых работ обсудить формат статьи в журнал WebOfKnowledge.

Требования к слушателям: слушатели знают базовый курс лекций К.В. Воронцова и программируют на Матлабе.

Мотивация

Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: 1) ставим задачу в формальном наиболее детализированном варианте, 2) делаем вычислительные эксперименты на Матлабе, 3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.

Сделать

Написать методические рекомендации для руководителей по планированию и проверке результатов работ.

Личные инструменты