Описательная статистика

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (оформление)
Строка 8: Строка 8:
Для более глубоких выводов о природе рассматриваемых данных используется [[индуктивная статистика]].
Для более глубоких выводов о природе рассматриваемых данных используется [[индуктивная статистика]].
-
В рамках описательной статистики используются следующие простейшие техники:
+
В рамках описательной статистики применяются следующие простейшие техники:
:* Графическое представление данных.
:* Графическое представление данных.
:* Табличное представление данных.
:* Табличное представление данных.
Строка 16: Строка 16:
:* Показать, в какой степени похожи различные рассматриваемые объекты.
:* Показать, в какой степени похожи различные рассматриваемые объекты.
:* Показать, в чём и насколько они различны.
:* Показать, в чём и насколько они различны.
-
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего используются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения.
+
При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи наиболее чаще всего применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.
-
Для решения второй задачи чаще всего используются такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.
+

Версия 09:38, 30 декабря 2008

Описательная статистика — один из разделов статистической науки, в рамках которого изучаются методы описания и представления основных свойств данных. Позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Применение описательной статистики включает следующие этапы:

  1. Сбор данных
  2. Категоризация данных
  3. Обобщение данных
  4. Представление данных

Для более глубоких выводов о природе рассматриваемых данных используется индуктивная статистика.

В рамках описательной статистики применяются следующие простейшие техники:

  • Графическое представление данных.
  • Табличное представление данных.
  • Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.

Обобщающие статистики используются для решения двух противоположных задач:

  • Показать, в какой степени похожи различные рассматриваемые объекты.
  • Показать, в чём и насколько они различны.

При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего применяются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи наиболее чаще всего применяют такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.

Личные инструменты