Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 274, осень 2015

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
(Список проектов)
Строка 260: Строка 260:
* '''Новизна''': Информационное обеспечение разведки и разработки нефтяных и газовых месторождений содержит большие массивы данных, включающих случайную и систематическую составляющую. Для задач интерпретации и прогноза необходима, как первая цель, общая математическая методика, позволяющая выявить систематическую составляющую вместе с оценкой достоверности и статистическими параметрами вклада случайной составляющей. Следующей, и основной целью, является разработка непосредственно самих методов интерпретации отфильтрованных достоверных данных и оценки коллекторских свойств продуктивных пластов (пористости, проницаемости, начальной нефтенасыщенности).
* '''Новизна''': Информационное обеспечение разведки и разработки нефтяных и газовых месторождений содержит большие массивы данных, включающих случайную и систематическую составляющую. Для задач интерпретации и прогноза необходима, как первая цель, общая математическая методика, позволяющая выявить систематическую составляющую вместе с оценкой достоверности и статистическими параметрами вклада случайной составляющей. Следующей, и основной целью, является разработка непосредственно самих методов интерпретации отфильтрованных достоверных данных и оценки коллекторских свойств продуктивных пластов (пористости, проницаемости, начальной нефтенасыщенности).
 +
* '''Консультант''': И.Л. Софронов, Московский научно-исследовательский центр Шлюмберже.
* '''Консультант''': И.Л. Софронов, Московский научно-исследовательский центр Шлюмберже.
 +
 +
=== Задача 2 ===
 +
* '''Название''': Определение области обоснованности регрессионной модели
 +
 +
* '''Задача''': Для молекул строятся регрессионные модели, которые по описанию молекулы предсказывают ее свойства (свободная энергия и т.д.). Нужно построить классификатор, который будет оценивать насколько стоит доверять предсказанным свойствам для новой молекулы: ошибается ли модель более чем на 30% в оценке свободной энергии молекулы.
 +
 +
* '''Данные''': открытые данные с PubMed и других источников, явные ссылки на источники есть у консультанта.
 +
 +
* '''Литература''':
 +
*# У консультанта имеются статьи, в которых рассматривается похожие задачи в хемоинформатике.
 +
*# Существует хорошая книга по регрессии на основе гауссовских процессов http://www.gaussianprocess.org/gpml/
 +
 +
 +
* '''Базовой алгоритм''': Предполагается, что для построения регрессионной модели будет использоваться алгоритм построения регрессионной модели на основе гауссовских процессов. В качестве дополнительного признака для классификации качества модели в точке можно использовать оценку неопределенности модели (апостериорную дисперсию).
 +
 +
* '''Решение''': ??
 +
 +
* '''Новизна''': Предполагается, что использование оценок неопределенности модели позволит улучшить классификацию точек на те, на которых модель достаточно точна и не очень точна. Предполагается, что студент предложит самостоятельно и другие признаки и оценит их полезность на практике.
 +
 +
* '''Консультант''': А.А. Зайцев, ИППИ РАН.

Версия 15:42, 2 сентября 2015

Короткая ссылка на эту страницу: http://goo.gl/7wpPlp

Автор Тема научной работы Ссылка Консультант Рецензент Доклады Буквы Сумма Оценка
Бернштейн Юлия
Бочкарев Артем
Гончаров Алексей
Двинских Дарина
Ефимов Юрий
Жариков Илья
Задаянчук Андрей
Златов Александр
Исаченко Роман
Нейчев Радослав
Подкопаев Александр
Решетова Дарья
Смирнов Евгений
Соломатин Иван
Черных Владимир
Шишковец Светлана
Камзолов Дмитрий

Задачи

Шаблон описания научной статьи

  • Название: Название, под которым статья подается в журнал.
  • Задача: Описание или постановка задачи. Желательна постановка в виде задачи оптимизации (в формате argmin). Также возможна ссылка на классическую постановку задачи.
  • Данные: Краткое описание данных, используемых в вычислительном эксперименте, и ссылка на выборку.
  • Литература: Список научных работ, дополненный 1) формулировкой решаемой задачи, 2) ссылками на новые результаты, 3) основной информацией об исследуемой проблеме.
  • Базовой алгоритм: Ссылка на алгоритм, с которым проводится сравнение или на ближайшую по теме работу.
  • Решение: Предлагаемое решение задачи и способы проведения исследования. Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
  • Новизна: Обоснование новизны и значимости идей (для редколлегии и рецензентов журнала).


Список проектов

Задача 1

  • Название: Анализ данных для выявления скрытых закономерностей в петрофизической информации, полученной лабораторными исследованиями керна
  • Задача: Имеются результаты измерений параметров керна скважины в некотором интервале по глубине, содержащим породу с газовой и нефтяной частями. Измерения имеют типичную лабораторную погрешность и возможные отскоки. Часть данных продублирована измерениями другой лаборатории. Требуется отсеять недостоверные данные, оценить достоверность отобранных данных, выявить подмножества определяющих параметров, с оценкой дисперсий. Построение соответствующих методов, учитывающих физику данных и типы пород, является составной частью задачи.
  • Данные: таблица с данными измерений керна по глубине, содержащими теплофизические свойства, плотность, пористость и проницаемость породы. Возможно добавление аналогичных таблиц с другими глубинами и/или скважинами.
  • Литература:
    1. У консультанта имеются полезные учебники по основам лабораторных исследований керна и свойствам пород (djvu)
    2. Математический инструментарий ожидается от научного руководителя
    3. Литературный обзор применяемых в нефтянке методик (см. следующий пункт) предлагается выполнить студенту самостоятельно, как одну из целей проекта.
  • Базовой алгоритм: Необходимо предварительное литературное исследование имеющихся в нефтегазовой науке методик с целью выявления их возможностей, сильных и слабых сторон. Ожидается либо усовершенствование известных подходов, либо успешное применение некоторого нового алгоритма.
  • Решение: ??
  • Новизна: Информационное обеспечение разведки и разработки нефтяных и газовых месторождений содержит большие массивы данных, включающих случайную и систематическую составляющую. Для задач интерпретации и прогноза необходима, как первая цель, общая математическая методика, позволяющая выявить систематическую составляющую вместе с оценкой достоверности и статистическими параметрами вклада случайной составляющей. Следующей, и основной целью, является разработка непосредственно самих методов интерпретации отфильтрованных достоверных данных и оценки коллекторских свойств продуктивных пластов (пористости, проницаемости, начальной нефтенасыщенности).


  • Консультант: И.Л. Софронов, Московский научно-исследовательский центр Шлюмберже.

Задача 2

  • Название: Определение области обоснованности регрессионной модели
  • Задача: Для молекул строятся регрессионные модели, которые по описанию молекулы предсказывают ее свойства (свободная энергия и т.д.). Нужно построить классификатор, который будет оценивать насколько стоит доверять предсказанным свойствам для новой молекулы: ошибается ли модель более чем на 30% в оценке свободной энергии молекулы.
  • Данные: открытые данные с PubMed и других источников, явные ссылки на источники есть у консультанта.
  • Литература:
    1. У консультанта имеются статьи, в которых рассматривается похожие задачи в хемоинформатике.
    2. Существует хорошая книга по регрессии на основе гауссовских процессов http://www.gaussianprocess.org/gpml/


  • Базовой алгоритм: Предполагается, что для построения регрессионной модели будет использоваться алгоритм построения регрессионной модели на основе гауссовских процессов. В качестве дополнительного признака для классификации качества модели в точке можно использовать оценку неопределенности модели (апостериорную дисперсию).
  • Решение: ??
  • Новизна: Предполагается, что использование оценок неопределенности модели позволит улучшить классификацию точек на те, на которых модель достаточно точна и не очень точна. Предполагается, что студент предложит самостоятельно и другие признаки и оценит их полезность на практике.
  • Консультант: А.А. Зайцев, ИППИ РАН.
Личные инструменты