Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, осень 2013

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Черновой список задач)
(Черновой список задач)
Строка 103: Строка 103:
*'''Аргументы.'''
*'''Аргументы.'''
 +
=== Определение нежелательных SMS-сообщений ===
 +
*'''Краткое описание.''' Фильтрация спам SMS рассылок посредством
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://www.dt.fee.unicamp.br/~tiago/smsspamcollection/
 +
*'''Аргументы.'''
 +
 +
=== Кластеризация треков по типу активности===
 +
*'''Краткое описание.''' Необходимо кластеризовать треки ежедневного человеческого быта по типу активности (например, спорт, шоппинг, дорога домой)
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://research.microsoft.com/en-us/downloads/b16d359d-d164-469e-9fd4-daa38f2b2e13/default.aspx
 +
*'''Аргументы.'''
 +
 +
=== Определение типа активности человека по данным с акселерометра ===
 +
*'''Краткое описание.''' Определение типа локальной активности (пеший ход, бег, подъем по лестнице и др.) по данным с акселерометра на теле человека.
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.'''
 +
**http://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones#
 +
**http://mldata.org/repository/data/viewslug/wearable-accelerometers-activity/
 +
*'''Аргументы.'''
 +
 +
=== Классификация сердцебиений ===
 +
*'''Краткое описание.''' Первичная сегментация кардиограммы. Классификация типов сердцебиений.
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://www.peterjbentley.com/heartchallenge/#dates
 +
*'''Аргументы.'''
 +
 +
=== Фильтрация вредоносных URL, по названию ресурса ===
 +
*'''Краткое описание.''' Фильтрация вредоносных URL, по названию ресурса (например фишинговые ссылки)
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://sysnet.ucsd.edu/projects/url/
 +
*'''Аргументы.'''
 +
 +
=== Задача навигации робота ===
 +
*'''Краткое описание.''' Робот вдоль стены, считывает показания с датчиков, и принимает решения о изменении траектории (поворот на 30, 60 и 90 градусов)
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://archive.ics.uci.edu/ml/datasets/Wall-Following+Robot+Navigation+Data
 +
*'''Аргументы.'''
 +
 +
=== Распознавания текста на фотографиях ===
 +
*'''Краткое описание.''' Локализация и распознавание текста на снимках Google Street View.
 +
*'''Базовый алгоритм.''' http://cmp.felk.cvut.cz/~neumalu1/neumann-cvpr2012.pdf
 +
*'''Данные.'''
 +
**http://algoval.essex.ac.uk/icdar/Datasets.html#Text Locating
 +
**http://vision.ucsd.edu/~kai/svt/
 +
*'''Аргументы.'''
 +
 +
=== Прогноз лесных пожаров ===
 +
*'''Краткое описание.''' Прогнозирование распространения лесных пожаров по метеорологическим данным.
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://archive.ics.uci.edu/ml/datasets/Forest+Fires
 +
*'''Аргументы.'''
 +
 +
=== Прогноз состояния продаваемой машины ===
 +
*'''Краткое описание.''' Оценка истинной стоимости продаваемого автомобиля
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://www.kaggle.com/c/DontGetKicked
 +
*'''Аргументы.'''
 +
 +
=== Прогнозирование выплат по страховке ===
 +
*'''Краткое описание.''' Прогнозирование выплат по страховке в случае ДТП на основании данных об автомобиле.
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://www.kaggle.com/c/ClaimPredictionChallenge
 +
*'''Аргументы.'''
 +
 +
=== Прогнозирование должностных зарплат ===
 +
*'''Краткое описание.''' Прогнозирование должностных зарплат по ключевым необходимым навыкам.
 +
*'''Базовый алгоритм.'''
 +
*'''Данные.''' http://www.kaggle.com/c/job-salary-prediction/data
 +
*'''Аргументы.'''
 +
 +
=== Локализация лиц на фотографии ===
 +
*'''Краткое описание.''' Прогнозирование должностных зарплат по ключевым необходимым навыкам.
 +
*'''Базовый алгоритм.''' http://www.cs.cmu.edu/~efros/courses/LBMV07/Papers/viola-cvpr-01.pdf
 +
*'''Данные.''' http://vis-www.cs.umass.edu/lfw/
 +
*'''Аргументы.'''
[[Категория:Учебные курсы]]
[[Категория:Учебные курсы]]

Версия 15:00, 9 сентября 2013


Черновой список задач

Выбор алгоритмов краткосрочного прогнозирования

  • Краткое описание. Создать алгоритм, осуществляющий выбор моделей прогнозирования на основе метаописания временных рядов.
  • Базовый алгоритм. Базовые модели для выбора: проект TSForecasting. Простейший метод для выбора моделей — дерево поиска. Метаописание временных рядов: А. И. Кобзарь Прикладная математическая статистика.
  • Данные. Цены на электроэнергию, биржевые данные, цены на хлеб.
  • Аргументы.

Прогнозирование цен на электроэнергию

  • Краткое описание. Построить авторегрессионный алгоритм прогнозирования; осуществить выбор признаков методом наименьших углов.
  • Базовый алгоритм. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. LARS.
  • Данные. Цены на электроэнергию.
  • Аргументы.

Распознавание геометрических фигур на фото

Поиск мелодии в базе данных

  • Краткое описание. Задана библиотека мелодий. Для короткого музыкального фрагмента требуется определить, какой мелодии он принадлежит.
  • Базовый алгоритм. Локальное прогнозирование.
  • Данные. Собрать библиотеку мелодий в формате .midi. matlab .midi parser
  • Аргументы.

Краткосрочное прогнозирование музыкальных произведений

Проверка подлинности подписей

Поиск похожих тезисов конференций

  • Краткое описание. Найти тезисы конференции OR-2013, близкие к заданному.
  • Базовый алгоритм.
  • Данные. Библиотека тезисов конференции OR-2013.
  • Аргументы.

Сегментация библиографических списков

Распознавание рукописных цифр

Ранжирование поисковой выдачи

Определение наличия и характеристик пульсовой волны

Построение рейтинга банков

Построение рейтинга научных журналов

  • Краткое описание. Построение совместного рейтинга научных журналов и публикующихся в них авторов.
  • Базовый алгоритм. Co-clusterization
  • Данные. Данные журнал-автор.
  • Аргументы.

Визуализация подписей-выносок

Прогнозирование редких продаж по набору временных рядов

Определение финансовых пузырей в биржевых данных

  • Краткое описание. Разработать метод определения финансовых пузырей в биржевых данных по ценам на сырье.
  • Базовый алгоритм. статья Вилли.
  • Данные. Цены на сырье.
  • Аргументы.

Прогнозирование управляемых макроэкономических показателей

Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя

Обнаружение причинно-следственных связей во временных рядах железнодорожных перевозок и биржевых данных

Распознавание лиц

Personalize Expedia Hotel Searches

Определение нежелательных SMS-сообщений

Кластеризация треков по типу активности

Определение типа активности человека по данным с акселерометра

Классификация сердцебиений

  • Краткое описание. Первичная сегментация кардиограммы. Классификация типов сердцебиений.
  • Базовый алгоритм.
  • Данные. http://www.peterjbentley.com/heartchallenge/#dates
  • Аргументы.

Фильтрация вредоносных URL, по названию ресурса

  • Краткое описание. Фильтрация вредоносных URL, по названию ресурса (например фишинговые ссылки)
  • Базовый алгоритм.
  • Данные. http://sysnet.ucsd.edu/projects/url/
  • Аргументы.

Задача навигации робота

  • Краткое описание. Робот вдоль стены, считывает показания с датчиков, и принимает решения о изменении траектории (поворот на 30, 60 и 90 градусов)
  • Базовый алгоритм.
  • Данные. http://archive.ics.uci.edu/ml/datasets/Wall-Following+Robot+Navigation+Data
  • Аргументы.

Распознавания текста на фотографиях

Прогноз лесных пожаров

  • Краткое описание. Прогнозирование распространения лесных пожаров по метеорологическим данным.
  • Базовый алгоритм.
  • Данные. http://archive.ics.uci.edu/ml/datasets/Forest+Fires
  • Аргументы.

Прогноз состояния продаваемой машины

  • Краткое описание. Оценка истинной стоимости продаваемого автомобиля
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/DontGetKicked
  • Аргументы.

Прогнозирование выплат по страховке

  • Краткое описание. Прогнозирование выплат по страховке в случае ДТП на основании данных об автомобиле.
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/ClaimPredictionChallenge
  • Аргументы.

Прогнозирование должностных зарплат

  • Краткое описание. Прогнозирование должностных зарплат по ключевым необходимым навыкам.
  • Базовый алгоритм.
  • Данные. http://www.kaggle.com/c/job-salary-prediction/data
  • Аргументы.

Локализация лиц на фотографии

Личные инструменты