Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014

Материал из MachineLearning.

Перейти к: навигация, поиск


Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы Результаты, Расписание, Постановка задач. --Strijov 02:09, 15 мая 2014 (MSD)


Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации. Cоздаются эксплуатационные интерфейсы. Результатами работы являются:

  1. эксплуатационная документация в формате systemdoics,
  2. код вычислительного эксперимента и тесты,
  3. версия кода для эксплуатаци[mvr.jmlda.org],
  4. доклады и презентация.


Результаты

Автор Тема научной работы Ссылка Консультант Доклады Буквы Сумма Оценка
Газизуллина Римма Про [1], pdf
Гринчук Алексей Выб [2], pdf
Гущин Александр Пос [3], pdf
Ефимова Ирина Диф [4], pdf
Жуков Андрей Пос [5], pdf
Игнатов Андрей Обу [6], pdf
Карасиков Михаил Пои [7], pdf
Кулунчаков Андрей Обн [8], pdf
Липатова Анна Обн [9], pdf
Макарова Анастасия Исп [10], pdf
Плавин Александр Опт [11], pdf И.О. Консультанта
Попова Мария Выб [12], pdf
Швец Михаил Инт [13], pdf
Шинкевич Михаил Вли [14], pdf
Sk Что
Sk Что
ВШЭ Что
ВШЭ Что

==

Анализ свойств включает следующие основные элементы:

  • тестирование постановки задачи и принятых (статистических) гипотез порождения данных
  • анализ ошибки или анализ регрессионных остатков,
  • анализ адекватности модели,
  • анализ условий применимости модели,
  • анализ сложности модели,
  • анализ вычислительной сложности алгоритмов построения или эксплуатации модели.

Результат:

  • модуль для построения модели (на языке Matlab),
  • юнит-тесты модуля,
  • вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
  • модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
  • юнит-тесты эксплуатируемой части,
  • конструкторская документация в формате Systemdocs, в частности:
    • мотивация проекта,
    • формальная постановка задачи,
    • IDEF модуля построения модели,
    • IDEF модуля эксплуатации модели (если требуется),
    • описание интерфейсов,
    • описание системных тестов и их результатов,
    • описание юнит-тестов,
    • анализ производительности.

Эксплуатация модели предполагается в одном из вариантов, доступных для широкого круга пользователей:

  • Модуль на Google Play / Apple Store,
  • Модуль на сервере mvr.jmlda.org.

Научная статья: написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса.

Требования к слушателям: слушатели знают базовый курс лекций К.В. Воронцова и программируют на Matlab'е.

Мотивация

Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: 1) ставим задачу в формальном наиболее детализированном варианте, 2) делаем вычислительные эксперименты на Матлабе, 3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.

Мы будем использовать тот инструмент, который позволит одну строку отчета или научной статьи представить в виде одной строки кода. Сейчас есть один такой инструмент - Matlab.

Сделать

Написать методические рекомендации для руководителей по планированию и проверке результатов работ.

Личные инструменты