Вариационный ряд

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (ссылки)
м
 
Строка 24: Строка 24:
::<tex>r_i = \frac{\sum\nolimits_{r=1}^m r \cdot [x_i = x^{(r)}]}{\sum\nolimits_{r=1}^m [x_i = x^{(r)}]} = \frac{k_1+k_2}2</tex>.
::<tex>r_i = \frac{\sum\nolimits_{r=1}^m r \cdot [x_i = x^{(r)}]}{\sum\nolimits_{r=1}^m [x_i = x^{(r)}]} = \frac{k_1+k_2}2</tex>.
 +
Если распределение, из которого взята выборка, имеет плотность <tex>f(x),</tex> то совместное распределение всех элементов вариационного ряда <tex>x^{(1)}, x^{(2)}, \cdots, x^{(m)}</tex> задаётся функцией
 +
::<tex>f_{1,2,\ldots,m}\left(y_1,y_2,\ldots,y_m\right)=n!f(y_1)f(y_2)\cdots f(y_m)I_{\{y_1<y_2<\cdots<y_m\}}.</tex>
== Литература ==
== Литература ==

Текущая версия

Вариационный ряд (set of order statistic) — последовательность значений заданной выборки x^m = (x_1,\ldots,x_m), расположенных в порядке неубывания:

x^{(1)} \leq x^{(2)} \leq \cdots \leq x^{(m)}.

k-й порядковой статистикой называется k-е значение в вариационном ряду x^{(k)}.

Рангом r_i наблюдения x_i называется его порядковый номер в вариационном ряду:

x^{(r_i)} = x_i.

Если x^mпростая выборка и функция распределения случайной величины x непрерывна, то с вероятностью 1 вариационный ряд не содержит равных элементов (все неравенства строгие), и данное выше определение ранга корректно. Если же функция распределения разрывна (в частности, если случайная величина x дискретна), то в вариационном ряду появляются связки, и значение ранга для некоторых элементов определяется неоднозначно.

Связкой размера t называется подпоследовательность вариационного ряда x^{(k_1)}, \ldots, x^{(k_2) такая, что k_2-k_1+1 = t и

x^{(1)} \leq \cdots < \underbrace{x^{(k_1)} = \cdots = x^{(k_2)}}_t < \cdots \leq x^{(m)}.

Существует много способов обобщить определение ранга элемента на тот случай, когда в вариационном ряду имеются связки. Чаще всего применяется средний ранг.

Средним рангом r_i наблюдения x_i называется средний порядковый номер элементов той связки \{k_1,\ldots,k_2\}, в которую попал элемент x_i:

r_i = \frac{\sum\nolimits_{r=1}^m r \cdot [x_i = x^{(r)}]}{\sum\nolimits_{r=1}^m [x_i = x^{(r)}]} = \frac{k_1+k_2}2.

Если распределение, из которого взята выборка, имеет плотность f(x), то совместное распределение всех элементов вариационного ряда x^{(1)}, x^{(2)}, \cdots, x^{(m)} задаётся функцией

f_{1,2,\ldots,m}\left(y_1,y_2,\ldots,y_m\right)=n!f(y_1)f(y_2)\cdots f(y_m)I_{\{y_1<y_2<\cdots<y_m\}}.

Литература

  1. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  2. Лапач С. Н. , Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002.
  3. Орлов А. И. Эконометрика. — М.: Экзамен, 2003.
  4. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.

Ссылки

Личные инструменты