Интервальная оценка

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Примеры интервальных оценок)
Строка 42: Строка 42:
*Для значений <tex>n\leq50</tex> номера порядковых статистик, заключающих в себе медиану, при <tex>\alpha=0.05</tex> и <tex>\alpha=0.01</tex> приведены в таблице 1, взятой из [3].
*Для значений <tex>n\leq50</tex> номера порядковых статистик, заключающих в себе медиану, при <tex>\alpha=0.05</tex> и <tex>\alpha=0.01</tex> приведены в таблице 1, взятой из [3].
 +
 +
===Пример 3. Доверительный интервал для математического ожидания.===
 +
Пусть задана выборка <tex>X^n=(x_1,\cdots,x_n)</tex> некоторой [[многомерная случайная величина|случайной величины]] <tex>X</tex>, арактеристики которой (дисперсия D и математическое ожидание M) неизвестны. Эти параметры оценим так:
 +
::<tex>M^*=\frac{\sum\limits_{i=1}^n{x_i}}{n}</tex>
 +
::<tex>D^*=\frac{\sum\limits_{i=1}^{n}{(x_i-M^*)^2}}{n-1}</tex> - несмещенная оценка дисперсии.
 +
 +
Величину <tex>\sqrt{D^*}</tex> называют оценкой средне-квадратичного отклонения.
 +
Воспользуемся тем, что величина <tex>M^*</tex> представляет собой сумму <tex>n</tex> независимых случайных величин, и, согласно центральной предельной теореме, при достаточно большом <tex>n</tex> ее закон близок к нормальному. Поэтому будем считать, что величина <tex>M^*</tex> распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно M (настоящее МО случайной величины <tex>X</tex>) и <tex>\frac{D}{n}</tex> (настоящая дисперсия).
==Литература==
==Литература==

Версия 21:07, 15 февраля 2010

Интервальное оценивание - один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра.

Содержание

Определение

Пусть \theta - неизвестный параметр генеральной совокупности. По сделанной выборке по определенным правилам находятся числа \theta_1 и \theta_2, такие чтобы выполнялось неравенство:

P\{\theta_1 < \theta < \theta_2 \} = 1-\alpha.

Интервал (\theta_1, \theta_2) является доверительным интервалом для параметра \theta, а число 1-\alpha - доверительной вероятностью или надежностью сделанной оценки. Обычно надежность задается заранее, причем выбираются числа близкие к 1 (0.95, 0.99 или 0.999).

Примеры интервальных оценок

Пример 1. Доверительное оценивание по вариационному ряду.

Пусть задана выборка X^n=(x_1,\cdots,x_n) некоторой случайной величины X. Построим вариационный ряд выборки x^{(1)}<\cdots<x^{(n)}:


Очевидно, что вероятность попасть в любой из (n+1) - го интервалов значений случайной ведичины X одинакова и равна \frac1{n+1}. Тогда вероятность того, что случайная величина X приняла значение из интервала (x^{(k)},x^{(l)}), где l>k будет равна:

P_{X^n,x}\{x\in(x^{(k)},x^{(l)})\} = \frac{l-k}{n+1}.

Вопрос: чему должен быть равен размер выборки n, чтобы вероятность попасть в интервал (\min\limits_i(x_i), \max\limits_i(x_i)) составила 95%.

Подставляя значение для доверительной вероятности в формулу выше, получим:
0.95 = P_{X^n,x}\{x\in(x^{(1)},x^{(n)})\} = \frac{n-1}{n+1},
откуда n=39.

Таким образом, при достаточном для заданной доверительной вероятности числе измерений случайной величины X по набору ее порядковых статистик может быть оценен диапазон принимаемых ею значений.

Пример 2. Доверительный интервал для медианы.

Таблица 1
Таблица 1

Пусть задана выборка X^n=(x_1,\cdots,x_n) некоторой случайной величины X.

x_k \leq \tilde x \leq x_{n-k+1},
где
k = \frac12 (n-1.64\sqrt n-1) при \alpha=0.1;
k = \frac12 (n-1.96\sqrt n-1) при \alpha=0.05;
k = \frac12 (n-2.58\sqrt n-1) при \alpha=0.01.
  • Для значений n\leq50 номера порядковых статистик, заключающих в себе медиану, при \alpha=0.05 и \alpha=0.01 приведены в таблице 1, взятой из [3].

Пример 3. Доверительный интервал для математического ожидания.

Пусть задана выборка X^n=(x_1,\cdots,x_n) некоторой случайной величины X, арактеристики которой (дисперсия D и математическое ожидание M) неизвестны. Эти параметры оценим так:

M^*=\frac{\sum\limits_{i=1}^n{x_i}}{n}
D^*=\frac{\sum\limits_{i=1}^{n}{(x_i-M^*)^2}}{n-1} - несмещенная оценка дисперсии.

Величину \sqrt{D^*} называют оценкой средне-квадратичного отклонения. Воспользуемся тем, что величина M^* представляет собой сумму n независимых случайных величин, и, согласно центральной предельной теореме, при достаточно большом n ее закон близок к нормальному. Поэтому будем считать, что величина M^* распределена по нормальному закону. Характеристики этого закона - математическое ожидание и дисперсия - равны соответственно M (настоящее МО случайной величины X) и \frac{D}{n} (настоящая дисперсия).

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  2. Гмурман В. Е. Теория вероятностей и математическая статистика. - М.: Высшая Школа, 2003.
  3. Закс Л. Статистическое оценивание / Пер. с нем. - М.: Статистика, 1976.

См. также

Ссылки

Личные инструменты