- Врсте степена слободе
- У механичком случају
- У скупу случајних вредности
- Примери
- Варијанса и степени слободе
- У дистрибуцији квадрата Цхи
- У тесту хипотезе (са решеним примером)
- Референце
Тхе степени слободе у статистици су број независних компоненти случајног вектора. Ако вектор има н компоненти и постоје п линеарне једначине које се односе на његове компоненте, тада је степен слободе нп.
Концепт степена слободе такође се појављује у теоријској механици, где су отприлике еквивалентни димензији простора у коме се честица креће, умањеном за број веза.
Слика 1. Њихало се креће у две димензије, али има само један степен слободе јер је приморано да се креће луком полупречника Л. Извор: Ф. Запата.
Овај чланак ће расправљати о концепту степена слободе који се примењује на статистику, али је механички пример лакши за визуализацију у геометријском облику.
Врсте степена слободе
У зависности од контекста у којем се примењује, начин израчунавања степена слободе може варирати, али основна идеја је увек иста: укупне димензије мање броја ограничења.
У механичком случају
Размотримо осцилирајућу честицу везану уз струну (клатно) која се креће у вертикалној ки равнини (2 димензије). Међутим, честица је приморана да се креће по обиму радијуса једнаком дужини акорда.
Пошто се честица може кретати само по тој кривуљи, број степени слободе је 1. То се може видети на слици 1.
Начин израчунавања степена слободе јесте узимање разлике броја димензија умањених за број ограничења:
степени слободе: = 2 (димензије) - 1 (лигатура) = 1
Друго објашњење које нам омогућава да постигнемо резултат је следеће:
-Знамо да је положај у две димензије представљен тачком координата (к, и).
-Али пошто тачка мора да буде у складу са једначином обима (к 2 + и 2 = Л 2 ) за дату вредност променљиве к, променљива и се одређује поменутом једначином или ограничењем.
На овај начин, само једна од променљивих је независна и систем има један (1) степен слободе.
У скупу случајних вредности
Да бисмо илустровали шта концепт значи, претпоставимо вектор
к = (к 1 , к 2 ,…, к н )
Представљајући узорак н нормално расподељених случајних вредности. У овом случају случајна вектора к има н независне компоненте и стога к каже се има н степени слободе.
Конструирајмо вектор р резидуала
р = (к 1 -
Где
Дакле, сума
(к 1 -
То је једначина која представља ограничење (или везивање) у елементима вектора р остатака, јер ако су познате н-1 компоненте вектора р , једначина рестрикције одређује непознату компоненту.
Стога је вектор р димензије н с ограничењем:
∑ (к и -
Има (н - 1) степена слободе.
Опет се примењује да је израчунавање броја степени слободе:
степени слободе: = н (димензије) - 1 (ограничења) = н-1
Примери
Варијанса и степени слободе
Варијанса с 2 је дефинисана као средина квадрата девијација (или резидуала) узорка н података:
с 2 = ( р • р ) / (н-1)
где је р вектор резидуала р = (к1 -
с 2 = ∑ (к и -
У сваком случају, треба напоменути да се при израчунавању просека квадрата заостатака дели на (н-1), а не на н, јер као што је речено у претходном одељку, број степени слободе вектора р је ( н-1).
Ако би се за рачунање варијанце делило са н уместо (н-1), резултат би имао пристраност која је веома значајна за вредности н мање од 50.
У литератури се формула варијанце такође појављује са деителником н уместо (н-1) када је у питању варијанца популације.
Али скуп случајне променљиве заостатака, представљен вектором р , иако има димензију н, има само (н-1) степена слободе. Међутим, ако је број података довољно велик (н> 500), обје формуле конвергирају се истом резултату.
Калкулатори и прорачунске табеле пружају и верзије варијансе и стандардну девијацију (која је квадратни корен варијансе).
Наша препорука, с обзиром на овде представљену анализу, је да увек одаберете верзију са (н-1) сваки пут када је потребно израчунати одступање или стандардно одступање, да се избегну пристрасни резултати.
У дистрибуцији квадрата Цхи
Неке расподјеле вјеројатности у континуираној случајној варијабли овисе о параметру који се зове ступањ слободе, ово је случај Цхи дистрибуције (χ 2 ).
Назив овог параметра долази управо из степена слободе основног случајног вектора на који се односи ова дистрибуција.
Претпоставимо да имамо г популације из којих су узети узорци величине н:
Кс 1 = (к1 1 , к1 2 ,… ..к1 н )
Кс2 = (к2 1 , к2 2 ,… ..к2 н )
….
Кс ј = (кј 1 , кј 2 ,… ..кј н )
….
Ксг = (кг 1 , кг 2 ,… ..кг н )
Популација ј која има средину
Стандардизована или нормализована варијабла зј и је дефинисана као:
зј и = (кј и -
А вектор Зј је дефинисан овако:
Зј = ( зј 1 , зј 2 ,…, зј и ,…, зј н ) и следи стандардизовану нормалну дистрибуцију Н (0,1).
Дакле променљива:
К = ((з1 1 ^ 2 + з2 1 ^ 2 +…. + Зг 1 ^ 2),…., (З1 н ^ 2 + з2 н ^ 2 +…. + Зг н ^ 2))
следи дистрибуцију χ 2 (г) која се назива хи-квадратна дистрибуција са степеном слободе г.
У тесту хипотезе (са решеним примером)
Када желите да тестирате хипотезе на основу одређеног скупа случајних података, морате знати број степени слободе г да бисте применили Цхи-квадрат тест.
Слика 2. Постоји ли веза између склоности сладоледа Арома и полова купца? Извор: Ф. Запата.
Као пример, анализираће се подаци прикупљени о преференцијама чоколадног или јагодног сладоледа код мушкараца и жена у одређеном салону сладоледа. Учесталост којом мушкарци и жене бирају јагоде или чоколаду сумирани су на слици 2.
Прво се израчунава табела очекиваних фреквенција која се припрема множењем укупног броја редова са укупним ступцима, подељеним са укупним подацима. Резултат је приказан на следећој слици:
Слика 3. Израчун очекиваних фреквенција на основу посматраних фреквенција (вриједности плаве боје на слици 2). Извор: Ф. Запата.
Тада се израчунава квадрат Цхи (из података) користећи следећу формулу:
χ 2 = ∑ (Ф о - Ф е ) 2 / Ф е
Где су Ф о посматране фреквенције (слика 2) и Ф е су очекиване фреквенције (слика 3). Збир прелази преко свих редова и ступаца који у нашем примеру дају четири појма.
Након обављених операција добијате:
χ 2 = 0.2043.
Сада је потребно упоредити са теоријским Цхи квадратом, који зависи од броја степени слободе г.
У нашем случају овај број се одређује на следећи начин:
г = (# реда - 1) (# ступаца - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Испада да је број степени слободе г у овом примеру 1.
Ако желите да проверите или одбаците нулту хипотезу (Х0: не постоји повезаност ТАСТЕ и СПОЛА) са нивоом значаја од 1%, теоријска вредност Цхи-квадрат-а се израчунава степеном слободе г = 1.
Тражи се вредност која чини акумулирану фреквенцију (1 - 0,01) = 0,99, односно 99%. Ова вредност (која се може добити из табела) је 6.636.
Пошто теоријски Цхи премаши израчунати, тада је нулта хипотеза верификована.
Другим речима, са прикупљеним подацима не примећује се однос између променљивих ТАСТЕ и ГЕНДЕР.
Референце
- Минитаб. Који су степени слободе? Опоравак од: суппорт.минитаб.цом.
- Мооре, Давид. (2009) Основне примењене статистике. Антони Босцх уредник.
- Леигх, Јеннифер. Како се израчунавају степени слободе у статистичким моделима. Опоравак од: гениоландиа.цом
- Википедиа. Степен слободе (статистика). Опоравак од: ес.википедиа.цом
- Википедиа. Степен слободе (физичке). Опоравак од: ес.википедиа.цом