Участник:Anton/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 4: Строка 4:
== Описание метода ==
== Описание метода ==
-
Пусть имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i</tex> (<tex>i=1,...,k </tex>) каждая. Средние значения выборок обозначим через <tex>\mu_i</tex>.
+
Пусть имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i</tex> (<tex>i=1,...,k </tex>) каждая. Через <tex>\mu_i</tex> обозначим математические ожидания распределений, из которых получены выборки.
-
=== Дополнительные предположения ===
+
Предположим, что
-
* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются [[нормальная выборка| нормальными]]''
+
# Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются [[Нормальное распределение| нормально-распределенными]].
 +
# Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> обладают одинаковыми дисперсиями.
=== Нулевая гипотеза ===
=== Нулевая гипотеза ===

Версия 19:01, 4 января 2010

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant Difference method.

Метод LSD позволяет проверять равенство средних значений нескольких выборок. Метод изобретен Фишером в 1935 году [1] и является первым методом множественных сравнений. Также известен как безопасный t-тест (protected t-test method).

Содержание

Описание метода

Пусть имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Через \mu_i обозначим математические ожидания распределений, из которых получены выборки.

Предположим, что

  1. Выборки x^{n_1}_1, . . . , x^{n_k}_k являются нормально-распределенными.
  2. Выборки x^{n_1}_1, . . . , x^{n_k}_k обладают одинаковыми дисперсиями.

Нулевая гипотеза

Метод LSD проверяет нулевую гипотезу H_0 о том, что средние значения всех k выборок одинаковы.

H_0: \mu_1 = \mu_2 =  . . . = \mu_k

Альтернативная гипотеза H_1: существует, по крайней мере, две выборки i и j (i \neq j) с несовпадающими средними значениями.

H_1: \mu_i  \neq \mu_j (для некоторых i \neq j).

Статистика метода LSD

Статистика метода LSD вычисляется в соответствии с соотношением:

T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}.

Здесь S^2_{int} - внутригрупповая дисперсия:

S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2


Описание метода

Если по F-критерию нулевая гипотеза о равенстве

Упорядочить средние значения выборок по убыванию.

  1. Для каждой соседней пары начиная с первой выполнить проверки значимости разности средних. Для проверки рассчитывается значение LSD. Для случая одинаково количества наблюдений в каждой выборке используется формула: LSD = t_{n-k, \alpha} \sqrt{\frac{2}{n_i}S_{BH}^2} = \sqrt{\frac{2}{n_i}S_{BH}^2F_{1, n-k, \alpha}}. Это значение используется для проверок всех пар. В ситуации когда объемы выборок различаются, используется формула: LSD_{a,b} = t_{n-k, \alpha} \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2} = \sqrt{\frac{n_a + n_b}{n_a n_b}S_{BH}^2F_{1, n-k, \alpha}}

Критическая область

Для статистики метода LSD критической областью при уровне значимости \alpha является область

\Omega_{\alpha}:\; T>t_{n-k,\alpha}

где  t_{n-k,\alpha} - квантиль распределения Стьюдента.

Для всех (i, i+1) проверяем гипотезу \overline{X}_{i+1} = \overline{X}_{i}. Если нулевая гипотеза H_0 выполнена, тогда объединяем X_i с X_{i+1}.


Пример использования

 X_i - цены на i-ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

Ссылки

  1. S. E. Maxwell, H. D. Delaney Designing experiments and analyzing data: a model comparison perspective. 2003. P. 229.

Литература

  1. Закс Л. Статистическое оценивание. — М.: Статистика, 1976. — 600 с.
  2. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистические методы в медико-биологических исследованиях с использованием Excel. — Киев: Морион, 2001. — 408 с.
  3. Scott E. Maxwell, Harold D. Delaney Designing experiments and analyzing data: a model comparison perspective. — 2003.
  4. Jason C. Hsu Multiple comparisons: theory and methods. — 1996.

См. также

Ссылки


Данная статья является непроверенным учебным заданием.
Студент: Участник:Anton
Преподаватель: Участник:Vokov
Срок: 15 декабря 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты