Статистический анализ данных (курс лекций, К.В.Воронцов)/2015, ФУПМ/1

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Новая: = Анализ поведения схожих критериев = Требуется исследовать поведение указанной пары статистических ...)
м
Строка 1: Строка 1:
 +
Ниже под обозначением <tex>X^n, \;\; X_i \sim p\cdot N(\mu,\sigma^2)+ \left(1-p\right)\cdot F</tex> понимается выборка объёма <tex>n</tex> из смеси нормального распределения <tex>N(\mu,\sigma^2)</tex> и распределения <tex>F</tex> с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации каждой выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из распределения F).
 +
= Анализ поведения схожих критериев =
= Анализ поведения схожих критериев =
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого.
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого.
* <tex> X_1^{n_1}, \;\; X_1 \sim F_1,</tex> <br> <tex> X_2^{n_2}, \;\; X_2 \sim F_2; <tex> <br> <tex> H_0 \,:\, F_1=F_2, </tex><br> <tex>H_1\,:\; H_0 </tex> неверна. <br>
* <tex> X_1^{n_1}, \;\; X_1 \sim F_1,</tex> <br> <tex> X_2^{n_2}, \;\; X_2 \sim F_2; <tex> <br> <tex> H_0 \,:\, F_1=F_2, </tex><br> <tex>H_1\,:\; H_0 </tex> неверна. <br>
-
::Лийко: <tex>F_1 = U\left[0,1\right], \;\; F_2 = U\left[a,a+1\right]</tex> —&nbsp; непрерывные равномерные распределения, <tex>a = 0\,:\,0.02\,:\,3, \;\; n_1=n_2=5\,:\,1\,:\,70.</tex> Сравнить критерии Смирнова и Крамера-фон Мизеса (функция cvm.test с параметром type="W2" в пакете dgof).
+
::Лийко: <tex>F_1 = U\left[0,1\right], \;\; F_2 = U\left[a,a+1\right]</tex> —&nbsp; непрерывные равномерные распределения; <tex>a = 0\,:\,0.02\,:\,3, \;\; n_1=n_2=5\,:\,1\,:\,70.</tex> Сравнить критерии Смирнова и Крамера-фон Мизеса (функция cvm.test с параметром type="W2" в пакете dgof).
::Ефимова: <tex>F_1 = N(0,1), \;\; F_2 = N(\mu,\sigma^2), \;\; \mu = 0\,:\,0.01\,:\,2, \;\; \sigma=0.5\,:\,0.01\,:\,2, \;\; n_1=n_2=30.</tex> Сравнить критерии Смирнова и Андерсона (функция cvm.test с параметром type="A2" в пакете dgof).
::Ефимова: <tex>F_1 = N(0,1), \;\; F_2 = N(\mu,\sigma^2), \;\; \mu = 0\,:\,0.01\,:\,2, \;\; \sigma=0.5\,:\,0.01\,:\,2, \;\; n_1=n_2=30.</tex> Сравнить критерии Смирнова и Андерсона (функция cvm.test с параметром type="A2" в пакете dgof).
-
<!---Ниже под обозначением <tex>X^n, \;\; X_i \sim p\cdot N(\mu,\sigma^2)+ \left(1-p\right)\cdot F</tex> понимается выборка объёма <tex>n</tex> из смеси нормального распределения <tex>N(\mu,\sigma^2)</tex> и распределения <tex>F</tex> с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации каждой выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из распределения F).
+
* <tex>X^n, \;\; X \sim p\cdot N(0,1)+ \left(1-p\right)\cdot F;</tex> <br> <tex> H_0\,:\; X \sim N,</tex> <br> <tex>H_1\,:\; H_0 </tex> неверна.
 +
::Лукманов: <tex>F = C\left(0,1\right)</tex>&nbsp;стандартное распределение Коши; <tex>n=20\,:\,1\,:\,100, \;\; p=0\,:\,0.01\,:\,1,</tex> сравнить критерии Шапиро-Уилка и хи-квадрат Пирсона.
 +
<!---
* <tex>X^n, \;\; X\sim Ber(p); </tex><br> <tex>H_0\,:\, p=p_0,</tex><br> <tex>H_1\,:\, p\neq p_0;</tex><br> <tex>p=0.01\,:\,0.01\,:\,0.5, \;\; n=5\,:\,1\,:\,70.</tex>
* <tex>X^n, \;\; X\sim Ber(p); </tex><br> <tex>H_0\,:\, p=p_0,</tex><br> <tex>H_1\,:\, p\neq p_0;</tex><br> <tex>p=0.01\,:\,0.01\,:\,0.5, \;\; n=5\,:\,1\,:\,70.</tex>
::Сендерович: <tex>p_0=\frac1{2}</tex>, сравнить z-критерии в версиях Вальда и множителей Лагранжа.
::Сендерович: <tex>p_0=\frac1{2}</tex>, сравнить z-критерии в версиях Вальда и множителей Лагранжа.
Строка 23: Строка 27:
* <tex>X^n, \;\; X\sim N(\mu,\sigma); </tex><br> <tex>H_0\,:</tex> среднее значение <tex>X</tex> равно нулю,<br> <tex>H_1\,:</tex> среднее значение <tex>X</tex> не равно нулю;<br> <tex>\mu=0\,:\,0.01\,:\,2, \;\; n=5\,:\,1\,:\,70.</tex>
* <tex>X^n, \;\; X\sim N(\mu,\sigma); </tex><br> <tex>H_0\,:</tex> среднее значение <tex>X</tex> равно нулю,<br> <tex>H_1\,:</tex> среднее значение <tex>X</tex> не равно нулю;<br> <tex>\mu=0\,:\,0.01\,:\,2, \;\; n=5\,:\,1\,:\,70.</tex>
::Козлов: <tex>\sigma=1,</tex> сравнить критерии знаков и знаковых рангов.
::Козлов: <tex>\sigma=1,</tex> сравнить критерии знаков и знаковых рангов.
-
 
-
* <tex>X^n, \;\; X \sim p\cdot N(0,1)+ \left(1-p\right)\cdot F;</tex> <br> <tex> H_0\,:\; X \sim N,</tex> <br> <tex>H_1\,:\; H_0 </tex> неверна; <br> <tex>n=20\,:\,1\,:\,100.</tex>
 
-
::Апишев: <tex>F = C\left(0,1\right)</tex>—&nbsp;стандартное распределение Коши; <tex>p=0\,:\,0.01\,:\,1,</tex> сравнить критерии Андерсона-Дарлинга и Лиллиефорса.
 
= Анализ устойчивости критериев к нарушению предположений =
= Анализ устойчивости критериев к нарушению предположений =

Версия 14:38, 2 марта 2015

Ниже под обозначением X^n, \;\; X_i \sim p\cdot N(\mu,\sigma^2)+ \left(1-p\right)\cdot F понимается выборка объёма n из смеси нормального распределения N(\mu,\sigma^2) и распределения F с весами p и 1-p соответственно (при генерации каждой выборки используется случайный датчик — если его значение не превосходит p, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из распределения F).

Анализ поведения схожих критериев

Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого.

  •  X_1^{n_1}, \;\; X_1 \sim F_1,
     X_2^{n_2}, \;\; X_2 \sim F_2; <tex> <br> <tex> H_0 \,:\, F_1=F_2,
    H_1\,:\; H_0 неверна.
Лийко: F_1 = U\left[0,1\right], \;\; F_2 = U\left[a,a+1\right] —  непрерывные равномерные распределения; a = 0\,:\,0.02\,:\,3, \;\; n_1=n_2=5\,:\,1\,:\,70. Сравнить критерии Смирнова и Крамера-фон Мизеса (функция cvm.test с параметром type="W2" в пакете dgof).
Ефимова: F_1 = N(0,1), \;\; F_2 = N(\mu,\sigma^2), \;\; \mu = 0\,:\,0.01\,:\,2, \;\; \sigma=0.5\,:\,0.01\,:\,2, \;\; n_1=n_2=30. Сравнить критерии Смирнова и Андерсона (функция cvm.test с параметром type="A2" в пакете dgof).
  • X^n, \;\; X \sim p\cdot N(0,1)+ \left(1-p\right)\cdot F;
     H_0\,:\; X \sim N,
    H_1\,:\; H_0 неверна.
Лукманов: F = C\left(0,1\right)— стандартное распределение Коши; n=20\,:\,1\,:\,100, \;\; p=0\,:\,0.01\,:\,1, сравнить критерии Шапиро-Уилка и хи-квадрат Пирсона.


Ссылки

Личные инструменты