Критерии однородности

Материал из MachineLearning.

Версия от 12:20, 19 октября 2013; Headrd (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Данная статья является непроверенным учебным заданием.
Студент: Участник:Anton
Преподаватель: Участник:Vokov
Срок: 8 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей. Рассмотрим такую классификацию критериев:

  1. Непараметрические (свободные от распределения) критерии однородности не предполагают присутствие какой-либо фундаментальной информации о законе распределения. Любое распределение можно описать параметром положения, характеризующим центр группирования случайных величин, и параметром масштаба, характеризующим степень рассеяния случайных величин относительно центра группирования. Когда закон распределения неизвестен, гипотезы о параметрах проверяются при помощи специальных критериев сдвига и масштаба. Также существуют двухвыборочные критерии согласия.
    1. Непараметрические критерии сдвига.
    2. Непараметрические критерии масштаба.
    3. Двухвыборочные критерии согласия.
  2. Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять

параметрические критерии однородности.

Содержание

Непараметрические критерии однородности

Непараметрические критерии сдвига

Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. Пусть заданы две выборки x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R},взятые из неизвестных непрерывных распределений F(x) и G(y) соответственно.

Нулевая гипотеза: H_0: \quad F(x) = G(y - \mu)

Наиболее частая альтернативная гипотеза: H_1: \quad F(x) \ne G(y - \mu).

Существует большое количество критериев, проверяющих эту гипотезу:

Ранговые критерии сдвига для двух выборок:

Ранговые критерии сдвига для нескольких (k>2) выборок:

Непараметрические критерии масштаба

Для двух выборок x^m = (x_1,\ldots,x_m),\; x_i \in \mathbb{R};\;\; y^n = (y_1,\ldots,y_n),\; y_i \in \mathbb{R}. проверяется гипотеза о том, что они принадлежат одному и тому же распределению, но с разным параметром масштаба. Если плотность распределения первой выборки — f(x), а второй выборки — \frac{1}{\tau}f( \frac{x}{\tau}), то нулевая гипотеза H_0: \quad \tau \ne 1.

Ранговые критерии масштаба для двух выборок:

Ранговые критерии масштаба нескольких (k>2) выборок:

Двухвыборочные критерии согласия

Параметрические критерии однородности

Сравнение параметров нормальных распределений

Сравнение двух средних значений

Имеются две выборки независимых случайных величин  x_1, x_2, \dots, x_n; \qquad y_1, y_2, \dots, y_n. Необходимо на основе выборочных данных установить наличие значимой разницы в средних двух совокупностей, из которых извлечены выборки.

Нулевая гипотеза:  H_0:\quad \mu_1 = \mu_2 .

Альтернативы: H_1:\quad \mu_1 \neq \mu_2; \qquad H_1': \quad \mu_1 > \mu_2; \qquad H_1'':\quad  \mu_1 < \mu_2.

Сравнение нескольких средних значений

Имеются k выборок из нормально распределенной совокупности x_{11},\dots,x_{1n_1}, \dots, x_{k1},\dots,x_{kn_k}.

Нулевая гипотеза H_0: \quad \mu_1=\dots=\mu_k

Альтернатива H_1: \quad |\mu_{i+1} - \mu_0 | > 0 \qquad (i=1,\dots,k).

решает задачу отделения выборки с наибольшим средним значением от всех остальных.

Сравнение двух дисперсий

Для двух нормально распределенных случайных величин x_1, \dots, x_n; \qquad y_1, \dots, y_m необходимо проверить гипотезу равенства дисперсий, опираясь на их выборочные оценки.

Сравнение нескольких дисперсий

Пусть  \sigma_1^2, \dots, \sigma_k^2 - дисперсии выборок

Нулевая гипотеза H_0: \quad \sigma_1^2=\dots=\sigma_k^2

Альтернатива H_1:\quad \sigma_1^2 \neq \sigma_i^2 \qquad (i=2,\dots,k).

Сравнение параметров экспоненциальных распределений

Сравнение двух параметров

Предположим, имеются две выборки из экспоненциальных распределений: x_1, \dots, x_n; \qquad y_1,\dots, y_m, т.е. из распределений с плотностями  f(x) = \frac{1}{\nu_1} \exp{\left( -\frac{x}{\nu_1} \right)}; \qquad g(y) = \frac{1}{\nu_2} \exp{\left( -\frac{y}{\nu_2} \right)}. Здесь \nu_1, \quad \nu_2 - параметры распределений (средние значения). Иногда на практике (задачи анализа надежности объектов) используют параметр  \lambda = \fra{1}{\nu} - интенсивность отказов.

Сравнение нескольких (k>1) параметров

Ссылки


Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  2. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.

См. также

Личные инструменты