Расстояние Кука

Материал из MachineLearning.

Перейти к: навигация, поиск

Расстояние Кука (Cook's distance) является широко используемым методом оценки влияния соответствующего наблюдения (элемента выборки) на уравнение регрессии. Эта величина показывает разницу между вычисленными коэффициентами уравнения регрессии и значениями, которые получились бы при исключении соответствующего наблюдения. В адекватной модели все расстояния Кука должны быть примерно одинаковыми; если это не так, то имеются основания считать, что соответствующее наблюдение (или наблюдения) смещает оценки коэффициентов регрессии.

Метод назван в честь американского статистика Р. Деннис Кук , который ввел данное понятие в 1977 году.

Определение

dg

Альтернативная постановка

Личные инструменты