Участник:Riabenko/Песочница

Материал из MachineLearning.

< Участник:Riabenko(Различия между версиями)

Текущая версия

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%A3%D1%87%D0%B0%D1%81%D1%82%D0%BD%D0%B8%D0%BA:Riabenko/%D0%9F%D0%B5%D1%81%D0%BE%D1%87%D0%BD%D0%B8%D1%86%D0%B0»

@@ Строка 1: / Строка 1: @@
-{{TOCright}}
-= Оценки =
-{|class = "standard sortable"
- ! class="unsortable"|№ п/п !! Студент !! Задание 1 (1 балл) !! Задание 2 (1 балл) !! Задание 3 (3 балла) !! Рецензировние задания 3 (1 балл) !! Сумма
- |-
- | align="center"|1 || Александров Я. ||   ||   ||   ||   ||
- |-
- | align="center"|2 || Артюхин С. ||  ||  ||  ||  ||
- |-
- | align="center"|3 || Бобрик К. ||  ||  ||  || ||
- |-
- | align="center"|4 || Гаврилюк К. ||  ||  ||  ||  ||
- |-
- | align="center"|5 || Елшин Д. ||  ||  ||  ||  ||
- |-
- | align="center"|6 || Ермушева А. ||  ||  ||  ||  ||
- |-
- | align="center"|7 || Зимовнов А.||  ||  ||  ||  ||
- |-
- | align="center"|8 || Игнатьев О. ||  ||  ||  ||  ||
- |-
- | align="center"|9 || Кириллов А. ||  ||  ||  ||  ||
- |-
- | align="center"|10 || Марченко Е.||  ||  ||  ||  ||
- |-
- | align="center"|11 || Матвеева Д. ||  ||  ||  ||  ||
- |-
- | align="center"|12 || Меркулова Т. ||  ||  ||  ||  ||
- |-
- | align="center"|13 || Некрасов К. ||  ||  ||  ||  ||
- |-
- | align="center"|14 || Новиков П. ||  ||  ||  || ||
- |-
- | align="center"|15 || Панов А. ||  ||  ||  ||  ||
- |-
- | align="center"|16 || Плященко Е. ||  ||  ||  ||  ||
- |-
- | align="center"|17 || Полежаев В. ||  ||  ||  ||  ||
- |-
- | align="center"|18 || Сабурова М. ||  ||  ||  ||  ||
- |-
- | align="center"|19 || Соколов Е.||  || || ||  ||
- |-
- | align="center"|20 || Фигурнов М. ||  ||  ||  ||  ||
- |-
- | align="center"|21 || Цупков С. ||  ||  ||  || ||
- |-
- | align="center"|22 || Шанин И. ||  ||  ||  ||  ||
- |}
-* Итоговая оценка вычисляется по формуле <tex>0.7*HomeWork+0.3*Oral</tex>, где Oral — оценка из пяти баллов за устный экзамен, HomeWork — баллы, набранные за практические задания. Нецелые значения округляются вверх.
-* Если первое или второе задание не сдано, до экзамена студент не допускается.
-* Штраф за просрочку сдачи заданий начисляется из расчета 0.1 балла за сутки.
-= Задание 1. Исследование свойств одномерных статистических критериев на модельных данных  =
-Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение
-[[Достигаемый уровень значимости|достигаемого уровня значимости]] (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо сгенерировать одну или несколько выборок из заданного распределения, выполнить [[Проверка статистических гипотез|проверку гипотезы]] при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
-# график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
-# график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
-# график с эмпирическими оценками [[Мощность критерия|мощности]] одного или двух критериев для разных значений параметров.
-В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся <tex>k</tex> раз для каждого набора значений параметров, и в <tex>m</tex> из <tex>k</tex> случаев гипотеза была отвергнута на некотором фиксированном уровне значимости <tex>\alpha</tex> (примем <tex>\alpha=0.05</tex>), оценкой мощности будет отношение <tex>m/k.</tex>
-Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и '''выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.)''', а также *.m-файл или R-скрипт, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
-Задание принимается до '''23:59 14.10'''.
-== Пример задания ==
-Исследуем чувствительность классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при зашумлении выборок наблюдениями, взятыми из равномерного распределения.
-<tex>x^n, \;\; x \sim 0.9\cdot N(\mu_1,1)+ 0.1\cdot U\left[-5+\mu_1,5+\mu_1\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-5+\mu_1,5+\mu_1\right]</tex> распределений  с весами <tex>0.9</tex> и <tex>0.1</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>0.9</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br>
-<tex>y^n, \;\; y \sim 0.9\cdot N(\mu_2,1)+ 0.1\cdot U\left[-5+\mu_2,5+\mu_2\right]</tex>&nbsp;— аналогичная выборка. <br>
-<tex>H_0\,:\; \mathbb{E}(x)=\mathbb{E}(y), \;\; H_1\,:\; \mathbb{E}(x)\neq\mathbb{E}(y).</tex>
-<tex>\mu_1=0, \;\; \mu_2=-2\,:\,0.01\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
-<gallery widths="250px" heights="250px">
-Изображение:Once_p.png|Значения достигаемого уровня значимости при однократной генерации выборок.
-Изображение:3000_p.png|Значения достигаемого уровня значимости, усрёднённые по 3000 экспериментам.
-Изображение:3000_pow.png|Значения эмпирических оценок мощности критерия при проведении 3000 экспериментов <tex>(\alpha=0.05).</tex>
-</gallery>
-Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов.
-Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. Когда, наоборот, разница между средними невелика (меньше 0.2-0.5 в зависимости от размера выборок), мощность близка к нулю, а среднее значение достигаемого уровня значимости колеблется около 0.5, что логично, так как его распределение при справедливости нулевой гипотезы равномерно на <tex>[0,1]</tex>.
-Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты.
-<gallery widths="500px" heights="250px">
-Изображение:Diff_ps.png|Разность средних достигаемых уровней значимости на выборках без шума и с шумом.
-Изображение:Diff_pows.png|Разность эмпирических оценок мощности на выборках без шума и с шумом.
-</gallery>
-Видно, что наличие шума всё меньше влияет на работу критерия с ростом объёма выборок и разницы между их средними. Тем не менее, в некоторых областях изменения параметров потеря мощности из-за 10% зашумления может составлять до 20%, а средний достигаемый уровень значимости может быть выше на 0.1.
-Отметим, что приведённые количественные выводы справедливы только для шума рассматриваемой структуры.
-== Задания==
-=== Анализ поведения схожих критериев ===
-Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого критерия.
-* <tex>x^n, \;\; x \sim N(0,1),\;\;y^n, \;\; y \sim N(\mu,1);</tex> <br> <tex>H_0\,:</tex> средние двух выборок равны, <tex>\;H_1\,:</tex> средние двух выборок не равны; <br> <tex>\mu=-2\,:\,0.02\,:\,2;\;\; n=10\,:\,5\,:\,100.</tex>
-::Студент: двухвыборочный [[критерий Стьюдента]] для независимых выборок и [[критерий Уилкоксона-Манна-Уитни]].
-::Студент: [[критерий Уилкоксона-Манна-Уитни]] и [[медианный критерий]].
-::Студент: [[критерий Уилкоксона-Манна-Уитни]] и двухвыборочный перестановочный критерий.
-* <tex>x^n, \;\; x \sim p\cdot N(0,1)+ \left(1-p\right)\cdot U\left[-a,a\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(0,1)</tex> и равномерного <tex>U\left[-a,a\right]</tex> распределений  с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br> <tex> H_0\,:\; x \sim N, \;\;\; H_1\,:\; H_0 </tex> неверна; <br> <tex>n=10\,:\,5\,:\,100.</tex>
-::Студент: [[критерий Шапиро-Уилка]] и [[критерий Колмогорова-Смирнова]], <tex>a=1, \;\; p=0\,:\,0.02\,:\,1</tex> <br>
-::Студент: [[критерий омега-квадрат]] и [[критерий Шапиро-Уилка]], <tex>a=2, \;\; p=0\,:\,0.02\,:\,1</tex>
-::Студент: [[критерий хи-квадрат]] и [[критерий омега-квадрат]], <tex>p=0.1, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
-::Студент: [[критерий Колмогорова-Смирнова]] и [[критерий хи-квадрат]], <tex>p=0.25, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
-* <tex>x^n, \;\; x \sim 0.5\cdot N(0,1)+ 0.5\cdot U\left[-a,a\right], \;\; y^n, \;\; y \sim 0.5\cdot N(0,\sigma^2)+ 0.5\cdot U\left[-a,a\right]</tex>&nbsp;— выборки длины <tex>n</tex> из смеси нормального  и равномерного <tex>U\left[-a,a\right]</tex> распределений  с равными весами (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>0.5</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br> <tex>H_0\,:</tex> дисперсии двух выборок равны, <tex>\;H_1\,:</tex> дисперсии двух выборок не равны; <br> <tex>\sigma=0.1\,:\,0.05\,:\,4.</tex>
-::Студент: [[критерий Зигеля-Тьюки]] и [[критерий Брауна-Форсайта]], <tex> a=3, \;\; n=10\,:\,5\,:\,100.</tex>
-::Студент: [[критерий Брауна-Форсайта]] и [[критерий О'Брайена]], <tex>a=0.5\,:\,0.1\,:\,5, \;\; n=50.</tex>
-::Студент: [[критерий О'Брайена]] и критерий [[Ансари-Бредли]], <tex> a=2, \;\; n=10\,:\,5\,:\,100.</tex>
-=== Анализ устойчивости критериев к нарушению предположений ===
-Требуется исследовать поведение указанного критерия в условиях нарушения лежащих в его основе предположений. Оценить мощность и достигаемый уровень значимости критерия при различных значениях параметров, сделать выводы об устойчивости
-* Двухвыборочный [[критерий Стьюдента]] для независимых выборок, нарушение предположения о нормальности.
-<tex>x^n \sim p_1\cdot N(\mu_1,1)+ \left(1-p_1\right)\cdot U\left[-a+\mu_1,a+\mu_1\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-a+\mu_1,a+\mu_1\right]</tex> распределений  с весами <tex>p_1</tex> и <tex>1-p_1</tex> соответственно (при генерации каждой выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p_1</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br>
-<tex>y^n \sim p_2\cdot N(\mu_2,1)+ \left(1-p_2\right)\cdot U\left[-a+\mu_2,a+\mu_2\right]</tex>&nbsp;— аналогичная выборка. <br>
-<tex>H_0\,:\; \mu_1=\mu_2, \;\; H_1\,:\; \mu_1\neq\mu_2;</tex> <br>
-<tex>\mu_1=0; \;\; \mu_2=-2\,:\,0.01\,:\,2.</tex> <br>
-::Студент: <tex>p_1=0.8, \;\; p_2=1, \;\; a=1, \;\; n=15\,:\,5\,:\,200.</tex>
-::Студент: <tex>p_1=0.9, \;\; p_2=1, \;\; a=5, \;\; n=15\,:\,5\,:\,200.</tex>
-::Студент: <tex>p_1=p_2=0.8, \;\; a=2, \;\; n=15\,:\,5\,:\,200.</tex>
-::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=1, \;\; n=150.</tex>
-::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=5, \;\; n=100.</tex>
-* [[Критерий Фишера]] для проверки равенства дисперсий, нарушение предположения о нормальности.
-<tex>x^n, \;\; x \sim p_1\cdot N(0,\sigma_1^2)+ \left(1-p_1\right)\cdot U\left[-a,a\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси нормального <tex>N(0,\sigma_1^2)</tex> и равномерного <tex>U[-a,a]</tex> распределений с весами <tex>p_1</tex> и <tex>1-p_1</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p_1</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного), <br>
-<tex>y^n,\;\; y \sim p_2\cdot N(0,\sigma_2^2)+ \left(1-p_2\right)\cdot U\left[-a,a\right]</tex>&nbsp;— аналогичная выборка,<br>
-<tex>H_0\,:\; var(x)=var(y), \;\; H_1\,:\; var(x)\neq var(y),</tex> <br>
-<tex>\sigma_1=2, \;\; \sigma_2=0.1\,:\,0.05\,:\,4.</tex> <br>
-::Студент: <tex>p_1=p_2=0.8, \;\; a=2, \;\; n=15\,:\,5\,:\,200.</tex>
-::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=2, \;\; n=150.</tex>
-::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=3, \;\; n=100.</tex>
-* Непараметрические критерии для проверки равенства дисперсий, нарушение предположения о равенстве медиан.
-<tex>x^n, \;\; x \sim N(0,1), \;\; y^n, \;\; y \sim N(\mu,\sigma^2);</tex> <br> <tex>H_0\,:\; var(x)=var(y), \;\; H_1\,:\; var(x)\neq var(y).</tex>
-::Студент: [[критерий Зигеля-Тьюки]], <tex>\mu=0\,:\,0.02\,:\,2, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=50.</tex>
-::Студент: [[критерий Зигеля-Тьюки]], <tex>\mu=1, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
-::Студент: [[критерий Ансари-Бредли]], <tex>\mu=0\,:\,0.02\,:\,2, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=50.</tex>
-::Студент: [[критерий Ансари-Бредли]], <tex>\mu=1, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>

Участник:Riabenko/Песочница

Материал из MachineLearning.

Текущая версия

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты