Ковариационный анализ

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(добавлены примеры задач)
(Добавлена книга Фишера)
Строка 23: Строка 23:
Основное назначение ковариационного анализа - использование в построении статистических оценок <tex>\theta_1,...,\theta_k</tex>; <tex>\beta_1,...,\beta_p</tex> и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели постулировать априори <tex>\beta_1=...=\beta_p=0</tex>, то получится модель ''дисперсионного анализа'', если же исключить влияние неколичественных факторов (положить <tex>\theta_1=...=\theta_k=0</tex>), то получится модель ''регрессионного анализа''.
Основное назначение ковариационного анализа - использование в построении статистических оценок <tex>\theta_1,...,\theta_k</tex>; <tex>\beta_1,...,\beta_p</tex> и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели постулировать априори <tex>\beta_1=...=\beta_p=0</tex>, то получится модель ''дисперсионного анализа'', если же исключить влияние неколичественных факторов (положить <tex>\theta_1=...=\theta_k=0</tex>), то получится модель ''регрессионного анализа''.
 +
== История
== Литература ==
== Литература ==
# ''Кендалл М.Дж., Стьюарт А.'' Многомерный статистический анализ и временные ряды. — М., 1976.
# ''Кендалл М.Дж., Стьюарт А.'' Многомерный статистический анализ и временные ряды. — М., 1976.
# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
# ''Шеффе Г.'' Дисперсионный анализ. — М., 1980.
 +
# ''Фишер Р. А.'' Статистические методы для исследователей. — М. Госстатиздат. 1958.
[[Категория:Дисперсионный анализ]]
[[Категория:Дисперсионный анализ]]
{{Задание|Tolstikhin|Vokov|31 декабря 2009}}
{{Задание|Tolstikhin|Vokov|31 декабря 2009}}

Версия 14:09, 8 января 2010

Ковариационный анализ - совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины Y одновременно от набора количественных факторов X и неколичественных факторов F. По отношению к Y переменные X называются сопутствующими. Факторы F задают сочетания условий качественной природы, при которых были получены наблюдения Y и X, и описываются с помощью так называемых индикаторных переменных, причем среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте).

Если случайная величина Y является вектором, то говорят о многомерном ковариационном анализе.

Примеры задач

Пример 1: Пусть у нас имеется 3 метода обучения арифметики и группа студентов. Студенты бьются случайным образом на 3 группы для обучения одним из методов. В конце курса обучения студенты проходят общий тест по результатам которого выставляются оценки. Также для каждого студента имеется одна или несколько характеристик (количественных) их общей образованности.

Требуется проверить гипотезу об одинаковой эффективности методик обучения.

Пример 2: Для сравнения качества нескольких видов крахмала (пшеничного, картофельного ...) был проведён эксперимент, в котором измерялась прочность крахмальных плёнок. Также для каждого испытания измерена толщина использовавшейся крахмальной плёнки.

Требуется проверить гипотезу об одинаковом качестве различного крахмала.

Постановка задачи

Основные теоретические и прикладные проблемы ковариационного анализа относятся к линейным моделям. В частности, если анализируются n наблюдений Y_1,...,Y_n с p сопутствующими переменными (X=(x^{(1)},...,x^{(p)})), k возможными типами условий эксперимента (F=(f_1,...,f_k)), то линейная модель соответствующего ковариационного анализа задается уравнением:

Y_i=\sum\limits_{j=1}^k{f_{ij}\theta_j} + \sum\limits_{j=1}^p{\beta_s(f_i)x_i^{(1)} + \eps_i(f_i)}

где i=1,...,n, индикаторные переменные f_{ij} равны 1, если j-е условие эксперимента имело место при наблюдении Y_i, и равны 0 в противном случае. Коэффициенты \theta_j определяют эффект влияния j-го условия, x_i^s - значение сопутствующей переменной x^{(s)}, при котором получено наблюдение Y_i. \beta_s(f_i) - значения соответствующих коэффициентов регрессии Y по x^{(s)}, \eps_i(f_i) - случайные ошибки с нулевым математическим ожиданием.

Основное назначение ковариационного анализа - использование в построении статистических оценок \theta_1,...,\theta_k; \beta_1,...,\beta_p и статистических критериев для проверки различных гипотез относительно значений этих параметров. Если в модели постулировать априори \beta_1=...=\beta_p=0, то получится модель дисперсионного анализа, если же исключить влияние неколичественных факторов (положить \theta_1=...=\theta_k=0), то получится модель регрессионного анализа.

== История

Литература

  1. Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. — М., 1976.
  2. Шеффе Г. Дисперсионный анализ. — М., 1980.
  3. Фишер Р. А. Статистические методы для исследователей. — М. Госстатиздат. 1958.


Данная статья является непроверенным учебным заданием.
Студент: Участник:Tolstikhin
Преподаватель: Участник:Vokov
Срок: 31 декабря 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.


Личные инструменты