- Дистрибуција фреквенције
- Колико часова узети у обзир?
- Како се добија?
- Пример
- За шта је то?
- Пример
- Референце
Ознака класе , позната и као средња вредност, је вредност у центру класе, која представља све вредности које су у тој категорији. У основи, ознака класе користи се за израчунавање одређених параметара, као што је аритметичка средина или стандардна девијација.
Дакле, ознака класе је средина било којег интервала. Ова вредност је такође веома корисна за проналажење варијанце скупа података који су већ груписани у класе, што нам заузврат омогућава да разумемо колико су удаљени од центра ти специфични подаци.
Дистрибуција фреквенције
Да бисмо разумели шта је ознака класе, неопходан је концепт дистрибуције фреквенција. С обзиром на скуп података, расподјела фреквенције је табела која податке дијели на бројне категорије које се зову класе.
Ова табела приказује број елемената који припадају свакој класи; потоњи је познат као фреквенција.
Ова табела жртвује део информација које добијамо из података, јер уместо да имају појединачну вредност сваког елемента, знамо само да припада тој класи.
С друге стране, добијамо боље разумевање скупа података, јер је на тај начин лакше ценити утврђене обрасце, што олакшава манипулацију наведеним подацима.
Колико часова узети у обзир?
Да бисмо извршили расподелу фреквенција, прво морамо одредити број класа које желимо да пођемо и изабрати њихова ограничења класе.
Избор колико часова треба да буде пригодан, узимајући у обзир да мали број часова може да сакрије податке о подацима које желимо да проучимо, а веома велики може да произведе превише детаља који нису нужно корисни.
Постоји неколико фактора које морамо узети у обзир при избору колико часова треба узети, али истичу се два: први је да узмемо у обзир колико података морамо узети у обзир; друго је знати колико је опсег дистрибуције (то је разлика између највећег и најмањег посматрања).
Након што су класе већ дефинисане, настављамо са бројем података у свакој класи. Овај број се назива фреквенција наставе и означава се са фи.
Као што смо раније рекли, имамо да расподјелом фреквенције губе се информације које долазе појединачно из сваког података или опажања. Из тог разлога се тражи вредност која представља целу класу којој припада; ова вредност је ознака класе.
Како се добија?
Ознака класе је основна вредност коју класа представља. Добија се сабирањем граница интервала и дељењем ове вредности са две. То можемо математички изразити на следећи начин:
к и = (доња граница + горња граница) / 2.
У овом изразу к и означавамо ознаку и класе.
Пример
С обзиром на следећи скуп података, дајте репрезентативну дистрибуцију фреквенције и добијете одговарајућу ознаку класе.
Пошто су подаци са највећом нумеричком вредношћу 391, а најнижом 221, имамо да је распон 391 -221 = 170.
Ми ћемо одабрати 5 часова, све исте величине. Један од начина избора часова је следећи:
Имајте на уму да су сваки подаци у класи, они су раздвојени и имају исту вредност. Други начин избора класе је разматрање података као дијела континуиране варијабле, која би могла достићи било коју стварну вриједност. У овом случају можемо размотрити класе обрасца:
205-245, 245-285, 285-325, 325-365, 365-405
Међутим, овај начин груписања података може представити неке нејасноће с границама. На пример, у случају 245, поставља се питање: којој класи припада, прва или друга?
Да би се избегла ова конфузија, доноси се конвенција о крајњој тачки. На овај начин, прва класа ће бити интервал (205,245], друга (245,285], и тако даље).
Након што су класе дефинисане, настављамо са израчунавањем фреквенције и имамо следећу табелу:
Након добивања фреквенцијске расподјеле података, настављамо са проналажењем класних ознака сваког интервала. У ствари, морамо:
к 1 = (205+ 245) / 2 = 225
к 2 = (245+ 285) / 2 = 265
к 3 = (285+ 325) / 2 = 305
к 4 = (325+ 365) / 2 = 345
к 5 = (365+ 405) / 2 = 385
То можемо представити следећим графиконом:
За шта је то?
Као што је претходно споменуто, ознака класе је веома функционална за проналажење аритметичке средње вредности и варијансе групе података која је већ групирана у различите класе.
Аритметичку средину можемо дефинисати као збир добијених опажања између величине узорка. С физичког становишта, његово тумачење је попут тачке равнотеже скупа података.
Идентифицирање читавог скупа података једним бројем може бити ризично, тако да се мора узети у обзир и разлика између ове точке прекида и стварних података. Ове вредности су познате као одступање од аритметичке средње вредности, а помоћу њих желимо утврдити колико варира аритметичка средина података.
Најчешћи начин проналажења ове вредности је варијанца, која је просек квадрата одступања од аритметичке средње вредности.
Да бисмо израчунали средњу аритметику и варијанцу скупа података груписаних у класи, користимо следеће формуле, респективно:
У овим изразима к и је ознака и-те класе, ф и представља одговарајућу фреквенцију и к број класа у које су подаци груписани.
Пример
Користећи се подацима из претходног примера, имамо да можемо мало више проширити податке табеле за расподелу фреквенција. Добијате следеће:
Затим, супституцијом података у формули, остаје нам аритметичка средина као:
Њена варијанца и стандардна девијација су:
Из овога можемо закључити да оригинални подаци имају аритметичку средину од 306,6, а стандардну девијацију 39,56.
Референце
- Фернандез Ф. Сантиаго, Цордоба Л. Алејандро, Цордеро С. Јосе М. Дескриптивна статистика. Есиц Уредништво.
- Јхонсон Рицхард А. Миллер и Фреунд Вјероватноћа и државници за инжењере. Пеарсон Едуцатион.
- Миллер И и Фреунд Ј. Вероватноћа и државници за инжењере. ВРАТИТИ СЕ.
- Сарабиа А. Јосе Мариа, Пасцуал Марта. Основни курс статистике за компаније
- Ллинас С. Хумберто, Ројас А. Царлос Описне статистике и дистрибуције вероватноће, Универсидад дел Норте