Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 174, осень 2014

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 4: Строка 4:
{{tip|Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы '''Результаты''', '''Расписание''', '''Постановка задач'''. --[[Участник:Strijov|Strijov]] 02:09, 15 мая 2014 (MSD)}}
{{tip|Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы '''Результаты''', '''Расписание''', '''Постановка задач'''. --[[Участник:Strijov|Strijov]] 02:09, 15 мая 2014 (MSD)}}
-
Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации, создаются эксплуатационные интерфейсы.
+
Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации. Cоздаются эксплуатационные интерфейсы. Результатами работы являются:
 +
# эксплуатационная документация в формате systemdoics,
 +
# код вычислительного эксперимента и тесты,
 +
# версия кода для эксплуатаци[mvr.jmlda.org],
 +
# доклады и презентация.
 +
 
 +
 
 +
 
 +
== Результаты ==
 +
{|class="wikitable"
 +
|-
 +
! Автор
 +
! Тема научной работы
 +
! Ссылка
 +
! Консультант
 +
! ДЗ-1
 +
! Буквы
 +
! Сумма
 +
! Оценка
 +
|-
 +
|[[Участник:rgazizullina|Газизуллина Римма]]
 +
|Про
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Gazizullina2014RailwayForecasting/], [http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Gazizullina2014RailwayForecasting/doc/Gazizullina2014RailwayForecasting.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Agrinchuk|Гринчук Алексей]]
 +
|Выб
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Grinchuk2014StructuredPrediction/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Grinchuk2014StructuredPrediction/doc/Grinchuk2014StructuredPrediction.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Aguschin|Гущин Александр]]
 +
|Пос
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Guschin2014FeaturesGeneration/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Guschin2014FeaturesGeneration/doc/Guschin2014DocumentRetrieval.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Iefimova|Ефимова Ирина]]
 +
|Диф
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Efimova2014DiagnosticsOfDiseases/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Efimova2014DiagnosticsOfDiseases/doc/Efimova2014DiagnosticsOfDiseases.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Azhukov|Жуков Андрей]]
 +
|Пос
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Zhukov2014UniversityRanking/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Zhukov2014UniversityRanking/doc/Zhukov2014UniversityRanking.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Aignatov|Игнатов Андрей]]
 +
|Обу
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Ignatov2014ManifoldsTraining/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Ignatov2014ManifoldsTraining/doc/Ignatov2014ManifoldsTraining.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Mkarasikov|Карасиков Михаил]]
 +
|Пои
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Karasikov2014MulticlassClassification/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Karasikov2014MulticlassClassification/doc/Karasikov2014MulticlassClassification.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Кулунчаков|Кулунчаков Андрей]]
 +
|Обн
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014IsomorphicStructures/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014IsomorphicStructures/doc/Kulunchakov2014IsomorphicStructures.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Alipatova|Липатова Анна]]
 +
|Обн
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Lipatova2014StructureLearning/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Lipatova2014StructureLearning/doc/Lipatova2014StructureLearning.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Nmakarova|Макарова Анастасия]]
 +
|Исп
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Makarova2014DynamicTS/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Makarova2014DynamicTS/doc/Makarova2014DynamicTS.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Aplavin|Плавин Александр]]
 +
|Опт
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Plavin2014TopicsNumberOptimization/doc/Plavin2014TopicsNumberOptimization.pdf?format=raw pdf]
 +
|[[Участник:AnyaP|И.О. Консультанта]]
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Mpopova|Попова Мария]]
 +
|Выб
 +
|[http://svn.code.sf.net/p/mlalgorithms/code/Group174/Popova2014OptimalModelSelection/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Popova2014OptimalModelSelection/doc/Popova2014OptimalModelSelection.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Mshvets|Швец Михаил]]
 +
|Инт
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Shvets2014MultimodelInterpretation/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Shvets2014MultimodelInterpretation/doc/Shvets2014MultimodelInterpretation.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|[[Участник:Mshinkevich|Шинкевич Михаил]]
 +
|Вли
 +
|[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Shinkevich2014RegularizatorsCombination/], [http://svn.code.sf.net/p/mlalgorithms/code/Group174/Shinkevich2014RegularizatorsCombination/doc/Shinkevich2014RegularizatorsCombination.pdf?format=raw pdf]
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|Sk
 +
|Что
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|Sk
 +
|Что
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|ВШЭ
 +
|Что
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|ВШЭ
 +
|Что
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|-
 +
|}
 +
 
 +
==
'''Анализ свойств''' включает следующие основные элементы:
'''Анализ свойств''' включает следующие основные элементы:
Строка 16: Строка 200:
'''Результат''':
'''Результат''':
* модуль для построения модели (на языке Matlab),
* модуль для построения модели (на языке Matlab),
 +
* юнит-тесты модуля,
* вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
* вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
-
* юнит-тесты (на двух языках)
 
* модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
* модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
 +
* юнит-тесты эксплуатируемой части,
* конструкторская документация в формате Systemdocs, в частности:
* конструкторская документация в формате Systemdocs, в частности:
** мотивация проекта,
** мотивация проекта,
** формальная постановка задачи,
** формальная постановка задачи,
** IDEF модуля построения модели,
** IDEF модуля построения модели,
-
** IDEF модуля эксплуатации модели,
+
** IDEF модуля эксплуатации модели (если требуется),
** описание интерфейсов,
** описание интерфейсов,
** описание системных тестов и их результатов,
** описание системных тестов и их результатов,
Строка 31: Строка 216:
'''Эксплуатация модели''' предполагается в одном из вариантов, доступных для широкого круга пользователей:
'''Эксплуатация модели''' предполагается в одном из вариантов, доступных для широкого круга пользователей:
* Модуль на Google Play / Apple Store,
* Модуль на Google Play / Apple Store,
-
* Модуль на сервере mvr.jmlda.org
+
* Модуль на сервере mvr.jmlda.org.
-
* Модуль на другом открытом веб-сервисе.
+
-
'''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.
+
'''Научная статья''': написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса. <!---Предполагается, что студент - соавтор статьи - является участником уже сложившейся научной группы, которая обеспечивает качество статьи.--->
'''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на Matlab'е.
'''Требования к слушателям''': слушатели знают базовый курс лекций К.В. Воронцова и программируют на Matlab'е.
Строка 40: Строка 224:
== Мотивация ==
== Мотивация ==
-
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом
+
Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом:
-
 
+
1) ставим задачу в формальном наиболее детализированном варианте,
-
1) делаем вычислительные эксперименты на Матлабе,
+
2) делаем вычислительные эксперименты на Матлабе,
-
 
+
3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.
-
2) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.
+
-
Мы будем использовать тот инструмент, который позволит одну строку научной статьи представить в виде одной строки кода. Сейчас есть один такой инструмент - Matlab. Возможно, таковым станет Mathematica для сложных постановок задач машинного обучения и анализа данных.
+
Мы будем использовать тот инструмент, который позволит одну строку отчета или научной статьи представить в виде одной строки кода. Сейчас есть один такой инструмент - Matlab. <!--- Возможно, таковым станет Mathematica для сложных постановок задач машинного обучения и анализа данных. --->
== Сделать ==
== Сделать ==

Версия 11:50, 26 августа 2014


Заметки и планы осеннего семестра. Материал будет убран на методическую страницу к концу августа. В сентябре тут будут опубликованы разделы Результаты, Расписание, Постановка задач. --Strijov 02:09, 15 мая 2014 (MSD)


Этот семестр посвящен постановке вычислительных экспериментов. Результатом эксперимента является анализ свойств математической модели, получаемой в результате решения поставленной задачи машинного обучения анализа данных. Построенная модель подготавливается к эксплуатации и представляется на языке, наиболее подходящем для эксплуатации. Cоздаются эксплуатационные интерфейсы. Результатами работы являются:

  1. эксплуатационная документация в формате systemdoics,
  2. код вычислительного эксперимента и тесты,
  3. версия кода для эксплуатаци[mvr.jmlda.org],
  4. доклады и презентация.


Результаты

Автор Тема научной работы Ссылка Консультант ДЗ-1 Буквы Сумма Оценка
Газизуллина Римма Про [1], pdf
Гринчук Алексей Выб [2], pdf
Гущин Александр Пос [3], pdf
Ефимова Ирина Диф [4], pdf
Жуков Андрей Пос [5], pdf
Игнатов Андрей Обу [6], pdf
Карасиков Михаил Пои [7], pdf
Кулунчаков Андрей Обн [8], pdf
Липатова Анна Обн [9], pdf
Макарова Анастасия Исп [10], pdf
Плавин Александр Опт [11], pdf И.О. Консультанта
Попова Мария Выб [12], pdf
Швец Михаил Инт [13], pdf
Шинкевич Михаил Вли [14], pdf
Sk Что
Sk Что
ВШЭ Что
ВШЭ Что

==

Анализ свойств включает следующие основные элементы:

  • тестирование постановки задачи и принятых (статистических) гипотез порождения данных
  • анализ ошибки или анализ регрессионных остатков,
  • анализ адекватности модели,
  • анализ условий применимости модели,
  • анализ сложности модели,
  • анализ вычислительной сложности алгоритмов построения или эксплуатации модели.

Результат:

  • модуль для построения модели (на языке Matlab),
  • юнит-тесты модуля,
  • вычислительный эксперимент, системные тесты: анализ свойств модели (то же),
  • модуль эксплуатации модели, код на языке эксплуатации (С, ++, #, Python, Java, CUDA, Ruby, VHDL, ...),
  • юнит-тесты эксплуатируемой части,
  • конструкторская документация в формате Systemdocs, в частности:
    • мотивация проекта,
    • формальная постановка задачи,
    • IDEF модуля построения модели,
    • IDEF модуля эксплуатации модели (если требуется),
    • описание интерфейсов,
    • описание системных тестов и их результатов,
    • описание юнит-тестов,
    • анализ производительности.

Эксплуатация модели предполагается в одном из вариантов, доступных для широкого круга пользователей:

  • Модуль на Google Play / Apple Store,
  • Модуль на сервере mvr.jmlda.org.

Научная статья: написание научной статьи приветствуется, но не входит в расписание проекта. Это связано с повышением требования к качеству статей студентов четвертого курса.

Требования к слушателям: слушатели знают базовый курс лекций К.В. Воронцова и программируют на Matlab'е.

Мотивация

Время работы человека гораздо ценнее времени работы компьютера. Поэтому мы работаем следующим образом: 1) ставим задачу в формальном наиболее детализированном варианте, 2) делаем вычислительные эксперименты на Матлабе, 3) полученные модели переписываем на том языке, на котором модели будут эксплуатироваться. Это может быть VHDL, в котором результатом компиляции является микросхема-процессор специального назначения увеличивающий скорость вычисления в миллионы раз, CUDA для видеопроцессоров, Java для телефонов, PL-SQL для систем коллективного пользования, Ruby on Rails для интернета.

Мы будем использовать тот инструмент, который позволит одну строку отчета или научной статьи представить в виде одной строки кода. Сейчас есть один такой инструмент - Matlab.

Сделать

Написать методические рекомендации для руководителей по планированию и проверке результатов работ.

Личные инструменты