Коэффициент корреляции Пирсона

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Определение

Даны две выборки

x=\left( x_1, \cdots ,x_n  \right), \; y=\left( y_1, \cdots ,y_n  \right)

Коэффициент корреляции Пирсена рассчитывается по формуле:

r_{xy} = \frac {\sum_{i=1}^{n} \left( x_i-\bar{x} \right)\left( y_i-\bar{y} \right)}{\sqrt{\sum_{i=1}^{n} \left( x_i-\bar{x} \right)^2 \sum_{i=1}^{n} \left( y_i-\bar{y} \right)^2}} = \frac {cov(x,y)}{\sqrt{S_x^2S_y^2}}

r_{xy} \in \left[-1,1\right] − теснота линейной связи.

Статистическая проверка наличия корреляции

Гипотеза H_0: Отсутствие линейной связи r_{xy} = 0

Статистика критерия:

 T = \frac{2xy\sqrt{n-2}}{sqrt{1-2x^2y^2}} \sim t_{n-2} - Распределение Стьюдента с n-2 степенью свободы.

Слабые стороны

  • Неустойчивость к выбросам

Литература

См. также

Ссылки

Корреляционный анализ


Статья в настоящий момент дорабатывается.
Венжега Андрей 21:51, 13 ноября 2008 (MSK)


Личные инструменты