Категориальные данные против числовых данных
Данные - это факты или информация, собранные для справки или анализа. Часто эти данные собираются как атрибут заинтересованного субъекта. Этот атрибут может варьироваться от одного к другому, поэтому этот изменяющийся атрибут можно рассматривать как переменную. Переменные могут принимать различные формы значений, и они являются неотъемлемой частью собранных данных.
Переменные могут быть качественными или количественными; т. е. если переменная является количественной, ответы будут числами, и величина измеряемого атрибута может быть указана с определенной степенью точности. Другой тип, качественные переменные, измеряют качественные атрибуты, и значения, принимаемые переменными, не могут быть даны в терминах размера или величины. Сами переменные известны как категориальные переменные, а данные, собранные с помощью категориальной переменной, являются категориальными данными.
Подробнее о числовых данных
Числовые данные - это в основном количественные данные, полученные от переменной, и значение имеет смысл размера / величины. Полученные числовые данные делятся на еще три категории на основе теории, разработанной Стэнли Смитом Стивенсом. Числовые данные могут быть порядковыми, интервальными или относительными. Тип данных определяется методом измерения значений, а типы известны как уровни измерения.
Вес человека, расстояние между двумя точками, температура и цена акции являются примерами числовых данных.
В статистике большинство методов основано на анализе числовых данных. Базовая описательная статистика, регрессия и другие методы вывода в основном используются для анализа числовых данных.
Подробнее о категориальных данных
Категориальные данные - это значения качественной переменной, часто числа, слова или символа. Они подчеркивают тот факт, что переменная в рассматриваемом случае принадлежит к одному из нескольких доступных вариантов. Следовательно, они относятся к одной из категорий; отсюда и название категоричное.
Политическая принадлежность человека, национальность человека, любимый цвет человека и группа крови пациента являются качественными атрибутами. Иногда число может быть получено как категориальное значение, но само число не отражает величину измеряемого атрибута. Почтовый индекс является одним из примеров.
Кроме того, любые категориальные значения относятся к номинальному типу данных, который является другим типом, основанным на уровнях измерений. Методы, используемые для анализа категориальных данных, отличаются от методов анализа числовых данных, но основной принцип может быть таким же.
В чем разница между категориальными и числовыми данными?
• Числовые данные - это значения, полученные для количественной переменной, которые несут ощущение величины, связанной с контекстом переменной (следовательно, это всегда числа или символы, несущие числовое значение). Категориальные данные - это значения, полученные для качественной переменной; категориальные числа данных не несут в себе смысла.
• Числовые данные всегда относятся к порядковому, относительному или интервальному типу, тогда как категориальные данные относятся к номинальному типу.
• Методы, используемые для анализа количественных данных, отличаются от методов, используемых для категориальных данных, даже если принципы одинаковы, по крайней мере, приложение имеет существенные различия.
• Числовые данные анализируются с использованием статистических методов в описательной статистике, регрессии, временных рядах и многих других.
• Для категориальных данных обычно используются описательные методы и графические методы. Также используются некоторые непараметрические тесты.