Анализ мультиколлинеарности (пример)
Материал из MachineLearning.
м  (→Методика Belsley, Kuh, и Welsch (BKW))  | 
				м  (→Методика Belsley, Kuh, и Welsch (BKW))  | 
			||
| Строка 26: | Строка 26: | ||
<tex>\mbox{var}({b}_{k})={\sigma}^{2}	\sum_{j} {\frac{{\upsilon}^{2}_{kj}}{{\mu}^{2}_{j}}}</tex>  | <tex>\mbox{var}({b}_{k})={\sigma}^{2}	\sum_{j} {\frac{{\upsilon}^{2}_{kj}}{{\mu}^{2}_{j}}}</tex>  | ||
, <tex>V\equiv({\upsilon}_{ij})</tex>  | , <tex>V\equiv({\upsilon}_{ij})</tex>  | ||
| + | {| class="wikitable" style="text-align: center;"  | ||
| + | |- bgcolor="#ccccc"  | ||
| + | ! width=70 % |Condition index   | ||
| + | ! width=50 % |<tex>var({b}_{l}) </tex>  | ||
| + | ! width=50 % |<tex>var({b}_{2}) </tex>  | ||
| + | ! width=100 % |<tex>... </tex>  | ||
| + | ! width=50 % |<tex>var({b}_{p}) </tex>  | ||
| + | |-  | ||
| + | | '''<tex>{\eta}_{1}</tex>''' || <tex>{\pi}_{11}</tex> || '''<tex>{\pi}_{12}</tex>''' || '''...''' || <tex>{\pi}_{1p}</tex>  | ||
| + | |-  | ||
| + | | '''<tex>{\eta}_{2}</tex>''' || <tex>{\pi}_{11}</tex> || '''...''' || '''...''' || <tex>{\pi}_{2p}</tex>  | ||
| + | |-  | ||
| + | | '''.''' || '''.''' || '''.''' ||   || '''.'''  | ||
| + | |-  | ||
| + | | '''.''' || '''.''' || '''.''' ||  || '''.'''  | ||
| + | |-  | ||
| + | | '''.''' || '''.''' || '''.''' || || '''.'''  | ||
| + | |-  | ||
| + | | '''<tex>{\eta}_{p}</tex>''' || <tex>{\pi}_{p1}</tex> || <tex>{\pi}_{11}</tex> || '''...''' || <tex>{\pi}_{pp} </tex>  | ||
| + | |-  | ||
| + | |}  | ||
== Вычислительный эксперимент ==  | == Вычислительный эксперимент ==  | ||
Версия 14:39, 9 мая 2010
Мультиколлинеарность — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат, которая затрудняет оценивание регрессионных параметров.
Содержание | 
Постановка задачи
Задана выборка  откликов и признаков. Рассматривается множество линейных регрессионных моделей вида:
Предполагается, что вектор регрессионных невязок имеет нулевое математическое ожидание и дисперсию 
.
Требуется создать инструмент исследования мультиколлинеарности признаков (методики VIF, Belsley) и исследовать устойчивость модели на зависимость параметров модели от дисперсии случайной переменной и выбросов в выборке.
Описание алгоритма
Фактор инфляции дисперсии (VIF)
Дисперсия :
 
Первая дробь связана с дисперсией невязок и дисперсией векторов признаков. Вторая — фактор инфляции дисперсии, связанный с корреляцей данного признака с другими:
где  — коэффициент детерминации j-го признака относительно остальных:
Равенство единице фактора инфляции дисперсии говорит об ортогональности вектора значений признака остальным. Если значение  велико, то 
 — мало, то есть 
 близко к 1. Большие значения фактора инфляции дисперсии соответствуют почти линейной зависимости j-го столбца от остальных.
Методика Belsley, Kuh, и Welsch (BKW)
Диагностика Коллинеарности BKW основана на двух элементах, относящихся к  матрице данных 
 использующейся в линейной регрессии 
 : the scaled condition indexes и the  variance-decomposition proportions. Оба этих диагностических элемента могут быть получены из сингулярного разложения (SVD) матрицы 
: 
, где 
 и 
 - диогональная с неотрицательными элементами 
 называющимися сингулярными значениями 
 :
, 
, 
| Condition index | ||||
|---|---|---|---|---|
|   |   |   | ... |   | 
|   |   | ... | ... |   | 
| . | . | . | . | |
| . | . | . | . | |
| . | . | . | . | |
|   |   |   | ... |   | 
Вычислительный эксперимент
Исходный код
Смотри также
Литература
|   |  Данная статья является непроверенным учебным заданием.
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 

