Эффективность подготовительных курсов для поступления на ВМК МГУ

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
==Постановка задачи==
==Постановка задачи==
-
Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК) на основании анализа таблиц сопряженности.
+
Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК).
==Исходные данные==
==Исходные данные==
{| border=1 cellpadding="12"
{| border=1 cellpadding="12"
Строка 12: Строка 12:
|219 || 208
|219 || 208
|}
|}
 +
Проверять будем гипотезу H<sub>0</sub>:ПК не эффективны.
 +
==Способ решения==
 +
Решать поставленную задачу будем с помощью анализа таблиц сопряженности.
 +
Основная формула метода: <br>
 +
<tex>X^{2}=n(\sum_{i=1}^{K}\sum_{j=1}^{L}\frac{n_{ij}^{2}}{n_{i}n_{j}}-1)\sim\chi_{(L-1)(K-1)}^{2}</tex>, где <br>
 +
<tex>n_{ij}=\sum_{(x,y)}[x=i][y=j]</tex><br>
 +
<tex>n_{i}=\sum_{j}n_{ij}</tex><br>
 +
<tex>n_{j}=\sum_{i}n_{ij}</tex><br>
 +
<tex>n=\sum_{i}\sum_{j}n_{ij}</tex><br>
 +
В нашем случае, для таблицы 2х2, т.е. когда K=L=2, можно применить упрощенную формулу: <br>
 +
<tex>X^{2}=\frac{n(ad-bc)^{2}}{(a+b)(a+c)(b+d)(c+d)}\sim\chi_{1}</tex>, где<br>
 +
<tex>n=a+b+c+d</tex><br>
 +
{| border=1 cellpadding="6" cellspacing="0"
 +
|
 +
{|
 +
! || y
 +
|-
 +
! x
 +
|}
 +
! 1 || 2
 +
|- align="center"
 +
! 1
 +
|a || b
 +
|- align="center"
 +
! 2
 +
|c || d
 +
|}<br>
 +
Тогда для нашей задачи получим <tex>X^{2}=18,491</tex>
 +
[[Изображение:Effective_PK.JPG|Распределение хи-квадрат]]
 +
Значит гипотеза H<sub>0</sub> отвергается, т.е. ПК эффективны для поступления на ВМК МГУ.
 +
==Литература==
 +
# [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2008]]
==Примечание==
==Примечание==
<references/>
<references/>
[[Категория:Учебные задачи]]
[[Категория:Учебные задачи]]

Версия 15:41, 26 декабря 2008

Содержание

Постановка задачи

Проверяется эффективность подготовительных курсов ВМК МГУ в 2008 году (далее ПК).

Исходные данные

Данные о поступивших на факультет ВМК МГУ[1] 2008 г.
Поступили Не поступили
Ходили 106 42
Не ходили 219 208

Проверять будем гипотезу H0:ПК не эффективны.

Способ решения

Решать поставленную задачу будем с помощью анализа таблиц сопряженности. Основная формула метода:
X^{2}=n(\sum_{i=1}^{K}\sum_{j=1}^{L}\frac{n_{ij}^{2}}{n_{i}n_{j}}-1)\sim\chi_{(L-1)(K-1)}^{2}, где
n_{ij}=\sum_{(x,y)}[x=i][y=j]
n_{i}=\sum_{j}n_{ij}
n_{j}=\sum_{i}n_{ij}
n=\sum_{i}\sum_{j}n_{ij}
В нашем случае, для таблицы 2х2, т.е. когда K=L=2, можно применить упрощенную формулу:
X^{2}=\frac{n(ad-bc)^{2}}{(a+b)(a+c)(b+d)(c+d)}\sim\chi_{1}, где
n=a+b+c+d

y
x
1 2
1 a b
2 c d

Тогда для нашей задачи получим X^{2}=18,491 Распределение хи-квадрат Значит гипотеза H0 отвергается, т.е. ПК эффективны для поступления на ВМК МГУ.

Литература

  1. Статистический анализ данных (курс лекций, К.В.Воронцов)/2008

Примечание

Личные инструменты