- Примери
- Класификација категоријских варијабли
- Номиналне категорије
- Ординал категоричан
- Бинарне категорије
- Статистика с категоријским варијаблама
- Графички приказ категоријских варијабли
- Решене вежбе
- Вежба 1
- Пример 2
- Пример 3
- Референце
Категоричан променљива је онај се користи у статистици доделити ненумерички или квалитативну особину или имовину неког објекта, индивидуални, ентитета, стања или поступка. Могуће је дефинисати све врсте категоријских променљивих према свакој потреби.
Примјери категоријских варијабли су: боја, спол, крвна група, брачни статус, врста материјала, облик плаћања или врста банковног рачуна, а користе се свакодневно.
Слика 1: Боја је категорична променљива. Извор: пикабаи
Наведене су варијабле, али њихове могуће вредности су квалитативне, односно квалитетне или карактеристичне, а не нумеричке мере. На пример, могуће вредности за променљиви пол су: мушко, х загрљај.
Када се ова променљива похрани у рачунарски програм, она се може декларирати као текстуална променљива, а једине прихваћене вредности ће бити оне које су већ именоване: Мале, Фемале.
Међутим, исти променљиви пол се може декларирати и похранити као цео број ако је мушко додељено 1, а женски додељено вредност 2. Из тог разлога се категоричке варијабле понекад називају набројаним типом.
Главна карактеристика категоријских променљивих је да за разлику од других променљивих, попут континуираних и дискретних променљивих, није могуће извршити аритметику са њима. Међутим, статистика се може радити с њима, као што ћемо видети касније.
Примери
Имајте на уму следеће примере категоријских променљивих и њихове могуће вредности:
- Гроуп_Сангуинео, распон вредности: А, Б, АБ, О
- Цивил_Статус, категоричке вредности: Појединачни (А), Ожењен (Б), Удовац (Ц), Разведен (Д).
- Типо_де_Материал, Категорије или вредности: 1 = Дрво, 2 = Метал, 3 = Пластика
-Форм_оф_Паимент, Хартије од вредности или категорије: (1) Готовина, (2) Дуговање, (3) Трансфер, (4) Кредит
У претходним примерима, број је повезан са сваком категоријом на потпуно произвољан начин.
Тада би се могло помислити да га ова произвољна нумеричка асоцијација чини еквивалентном дискретном квантитативном променљивом, али није, пошто се аритметичке операције не могу обавити са овим бројевима.
Да илуструјем идеју, у променљивој Форм_оф_Паимент, операција сума нема смисла:
(1) Готовина + (2) Дуг никада неће бити једнак (3) Трансфер
Класификација категоријских варијабли
Рангирање се заснива на томе да ли имају имплицитну хијерархију или не, или је број могућих исхода већи од два или два.
Категорична варијабла са само једним могућим исходом није променљива, она је категорична константа.
Номиналне категорије
Кад се не могу представити бројем или имати неки налог. На пример, променљива: Типе_оф_Материал, има номиналне вредности (дрво, метал, пластика), немају хијерархију или редослед, чак и када је сваком одговору или категорији додељен произвољан број.
Ординал категоричан
Вариабле: Ацадемиц_перформанце
Номиналне вриједности: висока, средња, ниска
Иако вредности ове променљиве нису нумеричке, имају имплицитни редослед или хијерархију.
Бинарне категорије
То су номиналне променљиве са два могућа одговора, на пример:
-Променљива: Одговор
-Номиналне вредности: Тачно, лажно
Имајте на уму да варијабла Респонсе нема имплицитну хијерархију и има само два могућа исхода, тако да је бинарна категорична променљива.
Неки аутори називају ову врсту бинарном променљивом и не сматрају да припада категоријским варијаблама које су ограничене на оне са више од три могуће категорије.
Статистика с категоријским варијаблама
Статистички подаци могу се вршити категоријским варијаблама, иако нису нумеричке или квантитативне варијабле. На пример, за познавање тренда или највероватније вредности категоричке променљиве узима се режим.
Начин је, у овом случају, највише поновљени резултат или вриједност категоричке варијабле. За категоријске варијабле није могуће израчунати ни средњу ни средњу вредност.
Средња вриједност се не може израчунати, јер не можете направити аритметику с категоријским варијаблама. Нити је средња, јер квантитативне или категоричке променљиве немају редослед или хијерархију, па није могуће утврдити централну вредност.
Графички приказ категоријских варијабли
С обзиром на одређену категоријску променљиву, може се наћи фреквенција или број пута с којима се резултат те променљиве понавља. Ако се то учини за сваки исход, тада се може направити графикон фреквенције према свакој категорији или исходу.
Ево неколико примера како категоричке променљиве могу бити графички представљене.
Решене вежбе
Вежба 1
Компанија има податке о 170 запослених. Једна од променљивих која се налази у овим записима је: Естадо_Цивил. Ова променљива има четири категорије или могуће вредности:
Неудана (А), удата (Б), удовица (Ц), разведена (Д).
Иако се ради о не нумеричкој варијабли, могуће је знати колико је укупних записа у одређеној категорији и бити представљено у облику траке, као што је приказано на следећој слици:
Слика 2. Приказ резултата категоријске варијабле. Извор: селф маде
Пример 2
Продавница обуће прати његову продају. Међу варијаблама које управљају њиховим записима је боја ципела за сваки модел. Променљива:
Цолор_Схое_Модел_АВ3
Она је категоријског типа и има пет категорија или могућих вредности. За сваку категорију ове променљиве сабире се број продаје и утврђује се проценат исте. Резултати су представљени на графикону следеће слике:
Слика 3. Категоријска променљива Боја _Схое. У овој променљивој мод је бели. Извор: селф маде.
Тада се може рећи да је АВ3 модел ципела који је у моди, а онај који се најчешће продаје је Вхите, а помно слиједи Блацк.
Такође се може рећи да ће са вероватноћом од 70% следећа ципела која се продаје овог модела бити бела или црна.
Ове информације могу бити корисне продавници приликом слања нових наруџби или чак могу примијенити попусте на најмање продате боје због вишка залиха.
Пример 3
За одређену популацију давалаца крви желите да представите број људи који припадају одређеној крвној групи. Графички начин за визуализацију резултата је помоћу пиктограма, који је на дну табеле.
Прва колона представља променљиву гроуп_сангуинео и њене могуће резултате или категорије. Друга колона приказује у иконичном или сликовном облику број људи у свакој категорији. У нашем примеру, црвена капљица се користи као икона, од којих свака представља 10 људи.
Слика 4. Пиктограм. Извор: селф маде
Референце
- Академија Кан. Анализа категоријских података. Опоравак од: кханацадеми.орг
- Формуле универзума. Квалитативна варијабла. Опоравак од: унивесоформулас.цом
- Минитаб. Које су категоричне, дискретне и континуиране променљиве. Опоравак од: суппорт.минитаб.цом
- Екцел туториал. Карактеризација променљивих. Опоравак од: хелп.клслат.цом.
- Википедиа. Статистичка променљива. Опоравак са википедиа.цом
- Википедиа. Категорична променљива. Опоравак са википедиа.цом
- Википедиа. Категорична променљива. Опоравак са википедиа.цом