Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Задачи)
(Задачи)
Строка 13: Строка 13:
|Signature Recognition
|Signature Recognition
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Bunakov2013SignatureRecognition/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Bunakov2013SignatureRecognition/]
-
| L+SIC>>>
+
| [BM+]L+SIC>>>
|-
|-
|Вдовина Евгения
|Вдовина Евгения
|Visualization of Results of Keyword Groups Mapping
|Visualization of Results of Keyword Groups Mapping
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Vdovina2013MappingResultsVisualization/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Vdovina2013MappingResultsVisualization/]
-
| L-S+I+C0D>
+
| [B]L-S+I+C0D>
|-
|-
|Воронов Сергей
|Воронов Сергей
|Распознавание текста на фотографиях
|Распознавание текста на фотографиях
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Voronov2013TextRecognition/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Voronov2013TextRecognition/]
-
| LS-I+CU+DT-
+
| [BM+]LS-I+CU+DT-
|-
|-
|Гринчук Олег
|Гринчук Олег
|Прогнозирование макроэкономических состояний (Векторная авторегрессия)
|Прогнозирование макроэкономических состояний (Векторная авторегрессия)
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Grinchuk2013InverseVAR/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Grinchuk2013InverseVAR/]
-
| L-SI-C-0D>
+
| [B]L-SI-C-0D>
|-
|-
|Дубовик Анна
|Дубовик Анна
|Classification and Exploring of Source Code of Python Projects.
|Classification and Exploring of Source Code of Python Projects.
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Dubovik2013ProjectCodeClassifying/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Dubovik2013ProjectCodeClassifying/]
-
| L0I-->>>0
+
| [M]L0I-->>>0
|-
|-
|Желавская Ирина
|Желавская Ирина
|Automatic Filters Generator for Gmail
|Automatic Filters Generator for Gmail
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhelavskaya2013FiltersGenerator/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhelavskaya2013FiltersGenerator/]
-
| LS->>>>0
+
| [BM+]LS->>>>0
|-
|-
|Жуйков Владимир
|Жуйков Владимир
|Распознавание подписей
|Распознавание подписей
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhuykov2013SignatureRecognition/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhuykov2013SignatureRecognition/]
-
| L--0I-->>>>
+
| [B]L--0I-->>>>
|-
|-
|Иванов Сергей
|Иванов Сергей
|Personalize Expedia Hotel Searches
|Personalize Expedia Hotel Searches
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Ivanov2013PersonalizeHotelSearches/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Ivanov2013PersonalizeHotelSearches/]
-
| +L-SI+>>
+
| [B]+L-SI+>>
|-
|-
|Иванов Александр
|Иванов Александр
|Detecting Unsolicited SMS Messages
|Detecting Unsolicited SMS Messages
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/IvanovA2013DetectingSMSSpam/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/IvanovA2013DetectingSMSSpam/]
-
| LSIC->>U
+
| [BM+]LSIC->>U
|-
|-
|Касаткин Сергей
|Касаткин Сергей
|Determination of the type of human activity based on the data from the accelerometer
|Determination of the type of human activity based on the data from the accelerometer
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kasatkin2013Accelerometer/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kasatkin2013Accelerometer/]
-
| L-S-I-->>>0
+
| [B]L-S-I-->>>0
|-
|-
|Катруца Александр
|Катруца Александр
|Ранжирование поисковой выдачи
|Ранжирование поисковой выдачи
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Katrutsa2013PageRank/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Katrutsa2013PageRank/]
-
|L+SI+CUD>
+
| [BM+]L+SI+CUD>
|-
|-
|Колчанов Андрей
|Колчанов Андрей
|The financial bubbles definition in the stock data
|The financial bubbles definition in the stock data
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kolchanov2013FinancialBubbles/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kolchanov2013FinancialBubbles/]
-
|0S-I->>>
+
| [B]0S-I->>>
|-
|-
|Костин Александр
|Костин Александр
|Classify Handwritten Digits
|Classify Handwritten Digits
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kostin2013ClassifyHandwrittenDigits/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kostin2013ClassifyHandwrittenDigits/]
-
| L+S-I
+
| [B]L+S-I
|-
|-
|Котенко Ленгольд Екатерина
|Котенко Ленгольд Екатерина
|Satellite imagery processing for NDVI estimation
|Satellite imagery processing for NDVI estimation
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kudryashova.Kotenko.NDVI/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kudryashova.Kotenko.NDVI/]
-
| L-S-IC-U>>
+
| [B]L-S-IC-U>>
|-
|-
|Кудряшова Александра
|Кудряшова Александра
|Satellite imagery processing for NDVI estimation
|Satellite imagery processing for NDVI estimation
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kudryashova.Kotenko.NDVI/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kudryashova.Kotenko.NDVI/]
-
| L-S-IC-U>>
+
| [B]L-S-IC-U>>
|-
|-
|Левдик Павел
|Левдик Павел
|Прогнозирование цен на электроэнергию
|Прогнозирование цен на электроэнергию
|
|
-
|0SI>U>
+
| [BM+]0SI>U>
|-
|-
|Матросов Михаил
|Матросов Михаил
|Short-term forecasting of musical compositions
|Short-term forecasting of musical compositions
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Matrosov2013MusicForecasting/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Matrosov2013MusicForecasting/]
-
| L-SIC-->>
+
| [B]L-SIC-->>
|-
|-
|Митяшов Андрей
|Митяшов Андрей
|Обработка сложноорганизованных социологических данных в задаче классификации
|Обработка сложноорганизованных социологических данных в задаче классификации
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Mityashov2013ClassificationSocialData/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Mityashov2013ClassificationSocialData/]
-
| L+SI--C-UD->
+
| [M+]L+SI--C-UD->
|-
|-
|Неклюдов Кирилл
|Неклюдов Кирилл
|Распознавание лиц
|Распознавание лиц
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Neklyudov2013FacialKeypointsDetection/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Neklyudov2013FacialKeypointsDetection/]
-
| LS-I+C>>
+
| [M+]LS-I+C>>
|-
|-
|Перекрестенко Дмитрий
|Перекрестенко Дмитрий
|Human activity recognition
|Human activity recognition
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Perekrestenko2013Accelerometer/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Perekrestenko2013Accelerometer/]
-
| L-SI-CU-D-T-
+
| [BM+]L-SI-CU-D-T-
|-
|-
|Прилепский Роман
|Прилепский Роман
-
|Text location and recognition on Google Street View Images.
+
|Text []Location and recognition on Google Street View Images.
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Prilepskiy2013GoogleStreetView/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Prilepskiy2013GoogleStreetView/]
-
| L+00>>>0
+
| [B]L+00>>>0
|-
|-
|Пушняков Алексей
|Пушняков Алексей
|Сегментация цветных изображений
|Сегментация цветных изображений
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Pushnyakov2013ImageSegmentation/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Pushnyakov2013ImageSegmentation/]
-
| L+S+I+C+UD
+
| [BM+]L+S+I+C+UD
|-
|-
|Рыскина Мария
|Рыскина Мария
|Создание тематической модели на основе PLSA
|Создание тематической модели на основе PLSA
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Ryskina2013TopicModelPLSA/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Ryskina2013TopicModelPLSA/]
-
| L--S+I+CUDT+
+
| [BM+]L--S+I+CUDT+
|-
|-
|Стенин Сергей
|Стенин Сергей
|Определение тематически близких тезисов научной конференции
|Определение тематически близких тезисов научной конференции
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Stenin2013Clustering/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Stenin2013Clustering/]
-
| L+S+I+CUD
+
| [B]L+S+I+CUD
|-
|-
|Уржумцев Олег
|Уржумцев Олег
|Поиск похожих тезисов конференций
|Поиск похожих тезисов конференций
|
|
-
|00IC>D
+
| [BM+]00IC>D
|-
|-
|Фейзханов Рустем
|Фейзханов Рустем
|Email filter generation
|Email filter generation
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Feyzkhanov2013FilterEmail/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Feyzkhanov2013FilterEmail/]
-
| LS-IC--U->(D-T--)
+
| [BM+]LS-IC--U->(D-T--)
|-
|-
|Шуйский Николай
|Шуйский Николай
|Поиск мелодии в базе данных
|Поиск мелодии в базе данных
|
|
-
|0S-0>>>>
+
| [B]0S-0>>>>
|-
|-
|Яшков Даниил
|Яшков Даниил
|Локализация лиц на фотографии
|Локализация лиц на фотографии
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Yashkov2013FaceDetection/]
|[https://svn.code.sf.net/p/mlalgorithms/code/Group074/Yashkov2013FaceDetection/]
-
| L-S-IC->>>
+
| [M+]L-S-IC->>>
|-
|-
|Welcome!
|Welcome!

Версия 10:50, 6 ноября 2013


Задачи

Автор Название задачи Ссылка LSICUDTPRWS
Бунаков Василий Signature Recognition [1] [BM+]L+SIC>>>
Вдовина Евгения Visualization of Results of Keyword Groups Mapping [2] [B]L-S+I+C0D>
Воронов Сергей Распознавание текста на фотографиях [3] [BM+]LS-I+CU+DT-
Гринчук Олег Прогнозирование макроэкономических состояний (Векторная авторегрессия) [4] [B]L-SI-C-0D>
Дубовик Анна Classification and Exploring of Source Code of Python Projects. [5] [M]L0I-->>>0
Желавская Ирина Automatic Filters Generator for Gmail [6] [BM+]LS->>>>0
Жуйков Владимир Распознавание подписей [7] [B]L--0I-->>>>
Иванов Сергей Personalize Expedia Hotel Searches [8] [B]+L-SI+>>
Иванов Александр Detecting Unsolicited SMS Messages [9] [BM+]LSIC->>U
Касаткин Сергей Determination of the type of human activity based on the data from the accelerometer [10] [B]L-S-I-->>>0
Катруца Александр Ранжирование поисковой выдачи [11] [BM+]L+SI+CUD>
Колчанов Андрей The financial bubbles definition in the stock data [12] [B]0S-I->>>
Костин Александр Classify Handwritten Digits [13] [B]L+S-I
Котенко Ленгольд Екатерина Satellite imagery processing for NDVI estimation [14] [B]L-S-IC-U>>
Кудряшова Александра Satellite imagery processing for NDVI estimation [15] [B]L-S-IC-U>>
Левдик Павел Прогнозирование цен на электроэнергию [BM+]0SI>U>
Матросов Михаил Short-term forecasting of musical compositions [16] [B]L-SIC-->>
Митяшов Андрей Обработка сложноорганизованных социологических данных в задаче классификации [17] [M+]L+SI--C-UD->
Неклюдов Кирилл Распознавание лиц [18] [M+]LS-I+C>>
Перекрестенко Дмитрий Human activity recognition [19] [BM+]L-SI-CU-D-T-
Прилепский Роман Text []Location and recognition on Google Street View Images. [20] [B]L+00>>>0
Пушняков Алексей Сегментация цветных изображений [21] [BM+]L+S+I+C+UD
Рыскина Мария Создание тематической модели на основе PLSA [22] [BM+]L--S+I+CUDT+
Стенин Сергей Определение тематически близких тезисов научной конференции [23] [B]L+S+I+CUD
Уржумцев Олег Поиск похожих тезисов конференций [BM+]00IC>D
Фейзханов Рустем Email filter generation [24] [BM+]LS-IC--U->(D-T--)
Шуйский Николай Поиск мелодии в базе данных [B]0S-0>>>>
Яшков Даниил Локализация лиц на фотографии [25] [M+]L-S-IC->>>
Welcome!

Расписание

Дата Что сделано Результат для обсуждения Код
Сентябрь 18 Выбрана задача, рецензент. Запись в ML. -
25 Собрана литература, написаны комментарии. Список литературы и мини-сообщение. Literatura
Октябрь 2 Поставлена задача для синтетических данных. Написана математическая постановка в формате TeX. Примерно страница текста. Statement
9 Создан файл отчета. Сделано описание проекта. Создана архитектура и интерфейс ядра системы (синтетические данные). Описание, IDEF0. Idef
16 Детализирован интерфейс, написан код первого приближения. Код для синтетических данных. Code
23 Написаны юнит-тесты и модуль, их запускающий. Юнит-тесты. Unit-test
30 Собраны реальные данные. Доработана схема IDEF0. Написаны модули подготовки данных. Данные, вторая схема IDEF0, модули. Data
Ноябрь 6 Написаны и запущены системные тесты. По результатам доработки кода написана рецензия на работу. Тесты, рецензия. Tests
13 Код оптимизирован. Отчет профайлера до и после. Profiler
20 Сделан визуальный отчет. Завершенный тех.отчет. Report
27 Разработан веб-интерфейс. Код на сайте. Web
Декабрь 4 Сделан пользовательский интерфейс и примеры. Доклад. Show

Работа и консультации

  1. Работы сдаются в течение недели.
  2. Желательна итеративная сдача работ, начинать показ лучше в выходные.
  3. Дедлайн последней версии работы: вторник 6:00am (проверка занимает весь вторник).
  4. В отчет будет добавлен пункт об учете времени, затраченном на выполнение проекта по неделям.
  • Каждый этап работ + 1 балл по системе (А--, А-, А, А+, А++),
  • Несделанная работа - 0.

Черновой список задач

Выбор алгоритмов краткосрочного прогнозирования

  • Краткое описание. Создать алгоритм, осуществляющий выбор моделей прогнозирования на основе метаописания временных рядов.
  • Базовый алгоритм. Базовые модели для выбора: проект TSForecasting. Простейший метод для выбора моделей — дерево поиска. Метаописание временных рядов: А. И. Кобзарь Прикладная математическая статистика.
  • Данные. Цены на электроэнергию, биржевые данные, цены на хлеб.
  • Аргументы.

Прогнозирование цен на электроэнергию

  • Краткое описание. Построить авторегрессионный алгоритм прогнозирования; осуществить выбор признаков методом наименьших углов.
  • Базовый алгоритм. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. LARS.
  • Данные. Цены на электроэнергию.
  • Аргументы.

Сегментация изображений

  • Краткое описание. Дана база данных изображений. Разработать алгоритм сегментации изображений по цветам.
  • Базовый алгоритм. Segmentation based on Gaussian mixture models
  • Данные. Любая БД изображения, например, berkeley
  • Аргументы.

Поиск мелодии в базе данных

  • Краткое описание. Задана библиотека мелодий. Для короткого музыкального фрагмента требуется определить, какой мелодии он принадлежит.
  • Базовый алгоритм. Локальное прогнозирование.
  • Данные. Библиотека мелодий в формате .midi. matlab .midi parser
  • Аргументы.

Краткосрочное прогнозирование музыкальных произведений

Распознавание подписей

Поиск похожих тезисов конференций

Сегментация библиографических списков

Распознавание рукописных цифр

Ранжирование поисковой выдачи

Обработка сложноорганизованных социологических данных в задаче классификации

  • Краткое описание. Решаемая прикладная задача - построение скоринговой модели. Основной проблемой является получение матрицы "объекты-признаки" из заполненной социологической анкеты.
  • Базовый алгоритм. Логистическая регрессия для классификации, для обработки данных - презентация ВВС
  • Данные. Данные банка OTP по скорингу
  • Аргументы.

Категоризация объектов Красной Книги

Определение наличия и характеристик пульсовой волны

Построение рейтинга научных журналов

  • Краткое описание. Построение совместного рейтинга научных журналов и публикующихся в них авторов.
  • Базовый алгоритм. Co-clusterization
  • Данные. Данные журнал-автор.
  • Аргументы.

Визуализация подписей-выносок

Прогнозирование редких продаж по набору временных рядов

  • Краткое описание. Разработать метод прогнозирования продаж, учитывая периодичность и тренд временных рядов.
  • Базовый алгоритм.
  • Данные. http://svn.code.sf.net/p/mvr/code/data/SalesDB/
  • Аргументы.

Определение финансовых пузырей в биржевых данных

  • Краткое описание. Разработать метод определения финансовых пузырей в биржевых данных по ценам на сырье.
  • Базовый алгоритм. статья Вилли.
  • Данные. Цены на сырье.
  • Аргументы.

Исследование изменения влияния макроэкономических показателей

  • Краткое описание. Требуется построить модель влияния экономических показателей на ВВП и оценить изменения влияния каждого показателя с течением времени.
  • Базовый алгоритм. Flexible least squares
  • Данные. Данные макроэкономических показателей
  • Аргументы.

Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя

  • Краткое описание. Требуется спрогнозировать показания одного из дорогостоящих датчиков в дизельном двигателе(лямбда-зонда) по показаниям других более дешевых датчиков. Специфика заключается в сильно-пересыщенном признаковом пространстве.
  • Базовый алгоритм. https://dl.dropboxusercontent.com/u/43790276/neweng.pdf
  • Данные. По запросу от Никиты Ивкина.
  • Аргументы.

Обнаружение причинно-следственных связей во временных рядах железнодорожных перевозок и биржевых данных

Распознавание лиц

Распознавание профилей

  • Краткое описание. По выделенному профилю лица человека определить, какому человеку этот профиль принадлежит.
  • Базовый алгоритм.
  • Данные. База данных профилей
  • Аргументы.

Personalize Expedia Hotel Searches

Прогнозирование землетрясений

  • Краткое описание. По историческим данным о землетрясениях требуется построить прогноз / оценить вероятность землетрясения в следующий промежуток времени.
  • Базовый алгоритм. Pattern shape analysis
  • Данные. Данныe USA gov. о землетрясениях
  • Аргументы.

Определение нежелательных SMS-сообщений

Кластеризация треков по типу активности

Определение типа активности человека по данным с акселерометра

Классификация сердцебиений

  • Краткое описание. Первичная сегментация кардиограммы. Классификация типов сердцебиений.
  • Базовый алгоритм.
  • Данные. http://www.peterjbentley.com/heartchallenge/#dates
  • Аргументы.

Фильтрация вредоносных URL, по названию ресурса

  • Краткое описание. Фильтрация вредоносных URL, по названию ресурса (например фишинговые ссылки)
  • Базовый алгоритм.
  • Данные. http://sysnet.ucsd.edu/projects/url/
  • Аргументы.

Задача навигации робота

  • Краткое описание. Робот вдоль стены, считывает показания с датчиков, и принимает решения о изменении траектории (поворот на 30, 60 и 90 градусов)
  • Базовый алгоритм.
  • Данные. http://archive.ics.uci.edu/ml/datasets/Wall-Following+Robot+Navigation+Data
  • Аргументы.

Распознавания текста на фотографиях

Прогноз лесных пожаров

  • Краткое описание. Прогнозирование распространения лесных пожаров по метеорологическим данным.
  • Базовый алгоритм.
  • Данные. http://archive.ics.uci.edu/ml/datasets/Forest+Fires
  • Аргументы.

Прогноз состояния продаваемой машины

  • Краткое описание. Оценка истинной стоимости продаваемого автомобиля
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/DontGetKicked
  • Аргументы.

Прогнозирование выплат по страховке

  • Краткое описание. Прогнозирование выплат по страховке в случае ДТП на основании данных об автомобиле.
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/ClaimPredictionChallenge
  • Аргументы.

Прогнозирование должностных зарплат

  • Краткое описание. Прогнозирование должностных зарплат по ключевым необходимым навыкам.
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/job-salary-prediction/data
  • Аргументы.

Локализация лиц на фотографии

Личные инструменты