Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Оценки

Студент №1 (1 б.) №2 (1 б.) №3 (2 б.) Рецензирование №3 (1 б.) №4 (2 б.) Рецензирование №4 (1 б.) Дополнительно \sum
Старожилец Всеволод 1 1 2
Вялый Евгений 0.9 0.9
Гончаров Фёдор 1 1 2
Каледин Станислав 0.8 1 1.8
Капаев Евгений 1 1
Коновалов Андрей 1 1
Кузнецов Роман 1 1
Петров Михаил 0.7 0.7
Хрипко Кирилл 0.8 0.8
Шепелев Денис 1 1
Вдовина Евгения 1 1
Воронов Сергей 1 1 2 4
Гринчук Олег 1 1 2
Катруца Александр 1 1 2 4
Кащеева Мария 0.9 0.9
Костин Александр 0.5 0.5
Неклюдов Кирилл 1 1 2 4
Перекрестенко Дмитрий 1 1
Пушняков Алексей 1 1 2 4
Рыскина Мария 1 1 2
Яшков Даниил 1 1 2 4
Бескровный Александр 0.7 0.7
Поляков Сергей
Соколова Евгения 1 1 2
Харченко Наталья 1 1 2
Балицкий Алексей 1 1 2 4
Довгаль Сергей 1 1
Трофимов Михаил 1 1 2
Папанов Артём 1 1
Мангатаев Доржи 0.9 1 1.9
  • Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений.
  • Штраф за просрочку сдачи заданий начисляется из расчета 0.1 балла за сутки.
  • Для получения зачёта необходимо сдать как минимум два задания: хотя бы одно из первых двух и хотя бы одно из последних двух.
  • Балл за рецензирование можно получить только при условии сдачи соответствующего задания.
  • Способы получения дополнительных баллов:

Доклады

Задание 1. Исследование свойств одномерных статистических критериев на модельных данных

Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:

  1. график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
  2. график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
  3. график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.

В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся k раз для каждого набора значений параметров, и в m из k случаев гипотеза была отвергнута на некотором фиксированном уровне значимости \alpha (примем \alpha=0.05), оценкой мощности будет отношение m/k.

Необходимо сдать: выполненный в Tex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т. д.), а также код на R, Матлабе или Питоне, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.

Задание принимается до 23:59 03.03.

Пример решения: чувствительность двухвыборочного критерия Стьюдента.

Подстраница с индивидуальными постановками задач.

Задание 2. Проверка гипотез на реальных данных

Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.

Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.

Задание принимается до 23:59 2.04.

Подстраница с индивидуальными постановками задач.

Ссылки

Личные инструменты