Достигаемый уровень значимости

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
м
Строка 2: Строка 2:
'''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]],
'''Достигаемый уровень значимости''' (пи-величина, англ. p-value) — это наименьшая величина [[уровень значимости|уровня значимости]],
-
при которой [[нулевая гипотеза]] отвергается для данного значения ''статистики критерия''&nbsp;<tex>T</tex>.
+
при которой [[нулевая гипотеза]] отвергается для данного значения [[Статистика (функция выборки)|статистики критерия]]&nbsp;<tex>T:</tex>
::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex>
::<tex>p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},</tex>
где
где
-
<tex>\Omega_\alpha</tex> — ''критическая область'' критерия.
+
<tex>\Omega_\alpha</tex> — критическая область критерия.
Другая интерпретация:
Другая интерпретация:
-
''достигаемый уровень значимости''&nbsp;<tex>p(T)</tex> — это вероятность, с которой (при условии истинности ''нулевой гипотезы'') могла бы реализоваться наблюдаемая выборка, или любая другая выборка с ещё менее вероятным значением статистики&nbsp;<tex>T</tex>.
+
достигаемый уровень значимости <tex>p(T)</tex> — это вероятность при справедливости [[нулевая гипотеза|нулевой гипотезы]] получить значение статистики, такое же или ещё более экстремальное, чем&nbsp;<tex>T.</tex>
Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение.
Случайная величина <tex>p(T(x^m))</tex> имеет равномерное распределение.
Фактически, функция <tex>p(T)</tex> приводит значение статистики критерия&nbsp;<tex>T</tex> к шкале вероятности.
Фактически, функция <tex>p(T)</tex> приводит значение статистики критерия&nbsp;<tex>T</tex> к шкале вероятности.
-
Маловероятным значениям (хвостам распределения) статистики&nbsp;<tex>T</tex> соотвествуют значения <tex>p(T)</tex>, близкие к нулю.
+
Маловероятным значениям (хвостам распределения) статистики&nbsp;<tex>T</tex> соотвествуют значения <tex>p(T),</tex> близкие к нулю.
Некоторые типичные заблуждения, связанные со значением пи-величины:
Некоторые типичные заблуждения, связанные со значением пи-величины:
Строка 22: Строка 22:
Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня
Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня
-
значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой - чем меньшее значение <tex>p(T)</tex> мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.
+
значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой - чем меньшее значение <tex>p(T)</tex> мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.
-
 
+
== Литература ==
== Литература ==
# ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
# ''Кобзарь А. И.'' Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.:&nbsp;Физматлит, 2006. — 816&nbsp;с.
# ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.:&nbsp;Солар, 2006. — 905&nbsp;с.
# ''Цейтлин Н. А.'' [http://freenet-homepage.de/nzarchiv/ Из опыта аналитического статистика]. — М.:&nbsp;Солар, 2006. — 905&nbsp;с.
-
# ''Всероссийский научно-исследовательский институт сертификации.'' Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. - М.:&nbsp;ВНИИС, 1987.
+
# ''Всероссийский научно-исследовательский институт сертификации.'' Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. М.:&nbsp;ВНИИС, 1987.
-
 
+
== Ссылки ==
== Ссылки ==
-
* [[Проверка статистических гипотез]] — о стандартной методике проверки статистических гипотез.
 
* [http://en.wikipedia.org/wiki/P-value P-value] — статья в англоязычной Википедии.
* [http://en.wikipedia.org/wiki/P-value P-value] — статья в англоязычной Википедии.
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]

Версия 13:18, 11 января 2012

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для данного значения статистики критерия T:

p(T) = \min \{ \alpha:\: T\in\Omega_\alpha \},

где \Omega_\alpha — критическая область критерия.

Другая интерпретация: достигаемый уровень значимости p(T) — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем T.

Случайная величина p(T(x^m)) имеет равномерное распределение. Фактически, функция p(T) приводит значение статистики критерия T к шкале вероятности. Маловероятным значениям (хвостам распределения) статистики T соотвествуют значения p(T), близкие к нулю.

Некоторые типичные заблуждения, связанные со значением пи-величины:

  • достигаемый уровень значимости не равен вероятности истинности нулевой гипотезы; частотная статистика вообще не имеет права приписывать вероятности гипотезам;
  • 1 – (достигаемый уровень значимости) не равно вероятности истинности альтернативной гипотезы;
  • достигаемый уровень значимости не равен вероятности ошибки первого рода;
  • 1 – (достигаемый уровень значимости) не равно вероятности ошибки второго рода;
  • достигаемый уровень значимости не есть вероятность того, что повторный эксперимент не приведёт к тому же решению.

Как правило, в практических задачах нет никакого разумного правила для выбора фиксированного уровня значимости. Выбирая метод достигаемого уровня значимости, мы можем сделать процедуру принятия решения более гибкой –- чем меньшее значение p(T) мы наблюдаем, тем сильнее свидетельствует совокупность наблюдений против нулевой гипотезы. Использование достигаемого уровня значимости вместо метода процентных точек рекомендуется нормативными документами Всероссийского научно-исследовательского института сертификации с 1987 года.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.
  2. Цейтлин Н. А. Из опыта аналитического статистика. — М.: Солар, 2006. — 905 с.
  3. Всероссийский научно-исследовательский институт сертификации. Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики. — М.: ВНИИС, 1987.

Ссылки

  • P-value — статья в англоязычной Википедии.
Личные инструменты