Парадокс хи-квадрат

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Описание задачи)
Строка 24: Строка 24:
| 400 || 280
| 400 || 280
|}
|}
-
 
+
<br>
{| border=1 cellpadding="6"
{| border=1 cellpadding="6"
! М+Ж|| Выздоровел(а) || Нет
! М+Ж|| Выздоровел(а) || Нет

Версия 11:14, 9 января 2009

Содержание

Описание задачи

Рассматривается следующий любопытный пример из области проверки однородности с помощью критерия хи-квадрат. В таблицах, приведённых ниже, содержится информация о действии некоторого метода лечения (заключается в приеме определенного лекарства) смертельно опасной болезни

  • отдельно на мужчин
  • отдельно на женщин
  • на больных обоего пола (объединённые результаты)
Мужчины Выздоровел Нет
Принимал 700 800
Нет 80 130


Женщины Выздоровела Нет
Принимала 150 70
Нет 400 280


М+Ж Выздоровел(а) Нет
Принимал(а) 850 870
Нет 480 410

Решение задачи

Используя критерий хи-квадрат для анализа таблиц сопряженности получим следующие статистики:

  • X2=5,456 для мужчин
  • X2=6,125 для женщин

Согласно таблице распределения хи-квадрат с одной степенью свободы находим, что фактические уровни значимости равны 0,02 и 0,01. Это свидетельствует о существенности различия вероятностей выздоровления между теми, кто использовал данный метод лечения и теми, кто его не использовал, т.е. лекарство влияет на выздоровление.

С другой стороны, статистика хи-квадрат для таблицы с объединенными результатами X2=4,782, что значимо велико на уровне 0,03, т.е. лекарство не влияет на выздоровление!

Г. Секей пишет: "Аналогично, новое лекарство может оказаться эффективным в каждом из десяти различных госпиталей, но объединение результатов укажет на то, что это лекарство либо бесполезно, либо вредно".

Причина парадокса

Нехватка данных.
Необходимо, чтобы Мпнпн

Литература

  1. Г. Секей "Парадоксы в теории вероятностей и математической статистике"
  2. Статистический анализ данных (курс лекций, К.В.Воронцов)/2008
Личные инструменты