Категориальные данные — это данные с предопределенным набором значений. Использование категорий "Ребенок", "Взрослый" или "Пожилой" вместо возраста человека в числовом виде является одним из примеров категоризации возраста. Однако, прежде чем использовать категориальные данные, необходимо знать о различных формах категориальных данных.
Прежде всего, категориальные данные могут быть определены в определенном порядке или нет. Сказать, что размер коробки маленький, средний или большой, означает, что существует порядок, описываемый как маленький < средний < большой. То же самое не относится, скажем, к спортивному инвентарю, который также может быть категориальными данными, но различается по названиям, таким как гантель, кистевой эспандер или перчатки; то есть вы можете упорядочить элементы на любой основе. Те, которые можно упорядочить, известны как "порядковые", а те, где такого упорядочения нет, по своей природе являются "номинальными".
dzone.com
How to Get a Frequency Table of a Categorical Variable as a Data Frame
Create attached notes ...
