Статистика (функция выборки)
Материал из MachineLearning.
м  (формулы, уточнение)  | 
			|||
| Строка 22: | Строка 22: | ||
=== Выборочная дисперсия ===  | === Выборочная дисперсия ===  | ||
| - | ::<tex>s^2 = \frac1m \sum_{i=1}^m \left( x_i - \bar x \right)^2.</tex>  | + | ::<tex>s^2 = s_m^2 = \frac1m \sum_{i=1}^m \left( x_i - \bar x \right)^2.</tex>  | 
[[Несмещённая оценка]] дисперсии:  | [[Несмещённая оценка]] дисперсии:  | ||
| - | ::<tex>s^2 = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2.</tex>  | + | ::<tex>s^2 = s_m^2 = \frac1{m-1} \sum_{i=1}^m \left( x_i - \bar x \right)^2.</tex>  | 
=== Выборочный момент ''k''-го порядка ===  | === Выборочный момент ''k''-го порядка ===  | ||
Версия 14:18, 11 августа 2008
 
  | 
Статистика — это измеримая функция выборки.
Также статистика — это область знаний (и соответствующие ей учебные дисциплины), в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.
Определение
Пусть задана случайная выборка  наблюдений 
.
Статистикой называется произвольная измеримая функция выборки
.
Любой статистический критерий основан на вычислении некоторой статистики и затем проверке, попадает ли её значение в область наиболее вероятных значений. Если не попадает, то нулевая гипотеза данного критерия отвергается.
Примеры наиболее часто используемых статистик приводятся ниже.
Все они предполагают, что наблюдения являются числовыми, .
В последние годы активно развивается также статистика объектов нечисловой природы.
Моменты
Выборочное среднее
Выборочная дисперсия
Несмещённая оценка дисперсии:
Выборочный момент k-го порядка
Выборочное среднее есть момент первого порядка.
Выборочный центральный момент k-го порядка
Выборочная дисперсия есть центральный момент второго порядка.
Несмещённые оценки центральных моментов:
Выборочный коэффициент асимметрии
Если плотность распределения симметрична, то . 
Если левый хвост распределения тяжелее, то . 
Если правый хвост распределения тяжелее, то . 
Выборочный коэффициент асимметрии используется для проверки распределения на симметричность, а также для грубой предварительной проверки на нормальность. Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.
Выборочный коэффициент эксцесса
Нормальное распределение имеет нулевой эксцесс, . 
Если хвосты распределения «легче», а пик острее, чем у нормального распределения, то .
Если хвосты распределения «тяжелее», а пик более «приплюснутый», чем у нормального распределения, то . 
Выборочный коэффициент эксцесса часто используется для грубой предварительной проверки на нормальность. Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.
Статистики, связанные с эмпирическим распределением
Эмпирическое распределение случайной величины , построенное по случайной выборке 
, есть функция 
При любом фиксированном  значение 
 можно рассматривать как статистику. 
Порядковые статистики
Порядковые статистики основаны на вычислении вариационного ряда,
который получается из исходной выборки 
путём упорядочивания её элементов по возрастанию:
Значение  называется k-й порядковой статистикой. 
Выборочная квантиль
Выборочная -квантиль при 
 есть 
Размах выборки
Выборочная медиана
Ранговые статистики
|   |  Статья в настоящий момент дорабатывается. Этот раздел скоро будет дописан  | 
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
 - Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
 
Ссылки
- Википедия:Статистика.
 - Skewness — коэффициент асимметрии.
 - Kurtosis — коэффициент эксцесса.
 

