Функция распределения
Материал из MachineLearning.
 (Новая: ==Определение==  '''Функция распределения''' случайной величины <tex>X</tex> - это числов...)  | 
				 (→Генерация случайной величины, имеющей заданное распределение)  | 
			||
| Строка 40: | Строка 40: | ||
==Генерация случайной величины, имеющей заданное распределение==  | ==Генерация случайной величины, имеющей заданное распределение==  | ||
| + | |||
| + | Рассмотрим случайную величину <tex>X</tex>, имеющую функцию распределения <tex>F_X(t)</tex>. Предположим, что <tex>F_X(t)</tex> '''непрерывна'''. Рассмотрим случайную величину   | ||
| + | |||
| + | <center><tex>Z=F_X(X)</tex>.</center>  | ||
| + | |||
| + | Легко показать, что тогда <tex>Z</tex> будет иметь [[равномерное_распределение|равномерное распределение]] на отрезке <tex>[0,1]</tex>.  | ||
| + | |||
| + | Обратно, пусть случайная величина <tex>Z</tex> имеет [[равномерное_распределение|равномерное распределение]] на отрезке <tex>[0,1]</tex>, а <tex>F(t)</tex> - произвольная функция распределения (т.е. удовлетворяет свойствам 1-4). Тогда случайная величина  | ||
| + | |||
| + | <center><tex>X=F^{-1}(Z)</tex></center>  | ||
| + | |||
| + | имеет функцию распределения <tex>F(t)</tex>. Это верно для любых функций распределения (не обязательно непрерывных), однако при этом обратная функция должна быть доопределена в точках разрыва следующим образом (в точках непрерывности это определения совпадает с обычным):  | ||
| + | |||
| + | <center><tex>F^{-1}(z)=\sup\{t:F(t)\le z\}</tex>.</center>  | ||
| + | |||
| + | Данное свойство дает универсальный способ генерации случайной величины, имеющей заданное распределение, с помощью величины, равномерно распределенной на отрезке <tex>[0,1]</tex>. Именно поэтому при построении генераторов псевдослучайных чисел обычно ограничиваются именно этим распределением.  | ||
| + | |||
| + | |||
[[Категория:Материалы по теории вероятностей]]  | [[Категория:Материалы по теории вероятностей]]  | ||
Версия 14:22, 9 ноября 2009
Определение
Функция распределения случайной величины  - это числовая функция, которая имеет вид:
Обозначение  используется для того, чтобы подчеркнуть, о какой случайной величине идет речь; если это ясно из контекста, то часто индекс опускают и обозначают функцию распределения просто 
Свойства
Функция распределения  определена на всей числовой оси и обладает следующими свойствами, вытекающими из свойств вероятностной меры:
1. 
2. , 
.
3. Функция распределения является неубывающей: если , то 
4. Функция распределения непрерывна слева:  для любого 
.
Примечание. Последнее свойство обозначает, какие значения принимает функция распределения в точках разрыва. Иногда определение функции распределения формулируют с использованием нестрогого неравенства: . В этом случае непрерывность слева заменяется на непрерывность справа: 
 при 
. Никакие содержательные свойства функции распределения при этом не меняются, поэтому данный вопрос является лишь терминологическим.
Свойства 1-4 являются характеристическими, т.е. любая функция , удовлетворяющая этим свойствам, является функцией распределения некоторой случайной величины.
Функция распределения задает распределение вероятностей случайной величины однозначно. Фактически, она является универсальным и наиболее наглядным способом описания этого распределения.
Чем сильнее функция распределения растет на заданном интервале числовой оси, тем выше вероятность попадания случайной величины в этот интервал. Если вероятность попадания в интервал равна нулю, то функция распределения на нем постоянна.
В частности, вероятность того, что случайная величина  примет заданное значение 
, равна скачку функции распределения в данной точке:
Если функция распределения непрерывна в точке , то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется непрерывным), то вероятность принять любое заданное значение равна нулю.
Из определения функции распределения вытекает, что вероятность попадания случайной величины в интервал, замкнутый слева и открытый справа, равна:
С помощью данной формулы и указанного выше способа нахождения вероятности попадания в любую заданную точку, легко определяются вероятности попадания случайной величины в интервалы других типов: , tex>[a,b]</tex> и tex>(a,b]</tex>. Далее, по теореме о продолжении меры, можно однозначно продолжить меру на все борелевские множества числовой прямой 
. Для того, чтобы применить эту теорему, требуется показать, что таким образом определенная на интервалах мера является на них сигма-аддитивной; при доказательстве этого в точности используются свойства 1-4 (в частности, свойство непрерывности слева 4, поэтому отбросить его нельзя).
Генерация случайной величины, имеющей заданное распределение
Рассмотрим случайную величину , имеющую функцию распределения 
. Предположим, что 
 непрерывна. Рассмотрим случайную величину 
Легко показать, что тогда  будет иметь равномерное распределение на отрезке 
.
Обратно, пусть случайная величина  имеет равномерное распределение на отрезке 
, а 
 - произвольная функция распределения (т.е. удовлетворяет свойствам 1-4). Тогда случайная величина
имеет функцию распределения . Это верно для любых функций распределения (не обязательно непрерывных), однако при этом обратная функция должна быть доопределена в точках разрыва следующим образом (в точках непрерывности это определения совпадает с обычным):
Данное свойство дает универсальный способ генерации случайной величины, имеющей заданное распределение, с помощью величины, равномерно распределенной на отрезке . Именно поэтому при построении генераторов псевдослучайных чисел обычно ограничиваются именно этим распределением.

