Описательная статистика

Материал из MachineLearning.

Перейти к: навигация, поиск

Описательная статистика — один из разделов статистической науки, в рамках которого изучаются методы описания и представления основных свойств данных. Позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Применение описательной статистики включает следующие этапы:

  1. Сбор данных
  2. Категоризация данных
  3. Обобщение данных
  4. Представление данных

Для более глубоких выводов о природе рассматриваемых данных используется Индуктивная статистика.

В рамках описательной статистики используются следующие простейшие техники:

  • Графическое представление данных.
  • Табличное представление данных.
  • Использование обобщающих статистик, таких, как математическое ожидание, медиана, дисперсия и т.д.

Обобщающие статистики используются для решения двух противоположных задач:

  • Показать, в какой степени похожи различные рассматриваемые объекты.
  • Показать, в чём и насколько они различны.

При обобщении количественных величин, таких, как длина, вес или возраст, для решения первой задачи чаще всего используются среднее арифметическое, медиана или мода, если распределение унимодально. Используются так же квантили – числовые характеристики функции распределения. Для решения второй задачи чаще всего используются такие меры неоднородности данных, как дисперсия, квадратный корень из дисперсии – стандартное отклонение, интерквантильный размах, стандартная ошибка среднего.

Личные инструменты