- Предности и мане
- Недостаци распона као мјера дисперзије
- Интерквартилни распон, квартил и обрађени пример
- - Прорачун квартила
- Први квартил
- Други квартил или медијан
- Трећи квартил
- Примери рада
- Решење за
- Решење б
- Решење ц
- Референце
Распон , распон или амплитуда, у статистици, је разлика (одузимања) између максималне вредности и минималне вредности сета података из узорка или популације. Ако је распон представљен словом Р, а подаци представљени са к, формула за распон је једноставно:
Р = к мак - к мин
Где је к мак максимална вредност података, а к мин је минимум.
Слика 1. Распон података који одговара становништву Кадиза у последња два века. Извор: Викимедиа Цоммонс.
Концепт је веома користан као једноставна мера дисперзије за брзу процену променљивости података, јер указује на продужење или дужину интервала на коме се они налазе.
На пример, претпоставимо да се мери висина групе од 25 мушкараца студента прве године студија на универзитету. Највиши ученик у групи је 1,93 м, а најкраћи 1,67 м. Ово су екстремне вредности узорчних података, па је њихов пут:
Р = 1,93 - 1,67 м = 0,26 м или 26 цм.
Висина ученика у овој групи распоређена је по овом распону.
Предности и мане
Распон је, као што смо већ рекли, мерило раширености података. Мали распон указује на то да су подаци мање или више блиски, а распрострањеност мала. С друге стране, већи распон указује на то да се подаци више дисперзирају.
Предности израчуна распона су очигледне: лако је и брзо пронаћи, јер је то једноставна разлика.
Такође има исте јединице као и подаци са којима ради, а концепт је лако протумачити за било којег посматрача.
На примеру висине студената инжењера, ако је распон био 5 цм, рекли бисмо да су сви студенти приближно исте величине. Али са распоном од 26 цм, одмах претпостављамо да у узорку постоје студенти свих средњих висина. Да ли је та претпоставка увек тачна?
Недостаци распона као мјера дисперзије
Ако пажљиво погледамо, може се десити да у нашем узорку од 25 студената инжењера само један мери 1,93, а преостала 24 висине близу 1,67 м.
Па ипак, домет остаје исти, мада је потпуно могуће супротно: висина већине је око 1,90 м, а само једна 1,67 м.
У оба случаја, дистрибуција података је сасвим другачија.
Слабости распона као мере дисперзије су зато што користи само екстремне вредности и игнорише све остале. Пошто је већина информација изгубљена, немате појма како се узорковани подаци дистрибуирају.
Друга важна карактеристика је да се распон узорка никада не смањује. Ако додамо још информација, тј. Размотримо више података, распон се повећава или остаје исти.
У сваком случају, користан је само при раду са малим узорцима, његова једина употреба као мерило дисперзије у великим узорцима се не препоручује.
Оно што се мора учинити је надопунити с израчунавањем других мера дисперзије које узимају у обзир информације које дају укупни подаци: интерквартилни распон, варијанца, стандардна девијација и коефицијент варијације.
Интерквартилни распон, квартил и обрађени пример
Схватили смо да је слабост распона као мере дисперзије та што он користи само екстремне вредности дистрибуције података, изостављајући остале.
Да би се избегле ове непријатности, користе се квартили: три вредности познате као мере мере.
Они расподјељују неугрупиране податке у четири дијела (друге широко кориштене мјере положаја су децил и постотил). Ово су његове карактеристике:
-Први квартил К 1 је вредност података тако 25% свих њих је мање од К 1 .
-У ИИ квартали К 2 представља медијана дистрибуције, што значи да половина (50%) података је мања од ове вредности.
Коначно, трећи квартил К 3 показује да 75% података су мање од К 3 .
Затим, интеркуартиле опсег или интеркуартиле опсег се дефинише као разлика између Трећи квартил К 3. и Први квартил К 1 података:
Интерквартилни распон = Р К = К 3 - К 1
На овај начин екстремне вредности не утичу на вредност распона Р К. Из тог разлога, препоручљиво је користити га када се бавите искривљеним дистрибуцијама, као што су оне врло високих или врло кратких ученика описаних горе.
- Прорачун квартила
Постоји неколико начина како их израчунати, овде ћемо предложити један, али у сваком случају потребно је знати редни број „Н о “, који је место које за то место користи одговарајући квартил у дистрибуцији.
То јест, ако нпр термин који одговара К 1 је друга, трећа или четврта и тако даље дистрибуције.
Први квартил
Н ор (К 1 ) = (Н + 1) / 4
Други квартил или медијан
Н ор (К 2 ) = (Н + 1) / 2
Трећи квартил
Н ор (К 3 ) = 3 (Н + 1) / 4
Где је Н број података.
Медијана је вредност која се налази тачно у средини дистрибуције. Ако је број података непаран, нема проблема да их пронађете, али ако је парно, две централне вредности се просече и постају једна.
Након што је број наруџбе израчунат, следи се једно од ова три правила:
-Ако нема децимала, претражују се подаци наведени у дистрибуцији и то ће бити квантитали који се тражи.
-Када је број налога на пола пута између два, тада се подаци означени целим делом успоређују са следећим подацима, а резултат је одговарајући квартил.
-У сваком другом случају заокружује се на најближи цели број и то ће бити положај квартила.
Примери рада
На скали од 0 до 20, група од 16 студената математике И освојила је следеће оцене на средњем испиту:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Пронађи:
а) Опсег или распон података.
б) Вриједности квартила К 1 и К 3
ц) Интерквартилни распон.
Слика 2. Да ли оцене на овом математичком тесту имају толику варијабилност? Извор: Пикабаи.
Решење за
Прво што требате пронаћи како бисте пронашли руту је да се подаци наручују у све већем или смањеном редоследу. На пример, у повећању налога имате:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Користећи формулу наведену на почетку: Р = к мак - к мин
Р = 20 - 1 бод = 19 поена.
Према резултату, ове оцене имају велику дисперзију.
Решење б
Н = 16
Н ор (К 1 ) = (Н + 1) / 4 = (16 + 1) / 4 = 17/4 = 4.25
То је број са децималама, чији је цео део 4., а затим идемо на дистрибуцију, тражимо податке који заузимају четврто место и чија вредност је упоредјена са вредностима пете позиције. Пошто су обојица 9, просек је такође 9 и тако:
К 1 = 9
Сада понављамо поступак за проналажење К 3 :
Н ор (К 3 ) = 3 (н + 1) / 4 = 3 (16 +1) / 4 = 12.75
Опет је децимална, али с обзиром да није на пола пута, заокружен је на 13. Тражени квартил заузима тринаесту позицију и гласи:
К 3 = 16
Решење ц
Р К = К 3 - К 1 = 16 - 9 = 7 бодова.
Који је, као што видимо, много мањи од распона података израчунатих у одељку а), јер је најмањи резултат био 1 бод, вредност знатно даље од остатка.
Референце
- Беренсон, М. 1985. Статистика за менаџмент и економију. Интерамерицана СА
- Цанавос, Г. 1988. Вероватноћа и статистика: Примене и методе. МцГрав Хилл.
- Деворе, Ј. 2012. Вероватноћа и статистика за инжењерство и науку. 8тх. Едитион. Ценгаге.
- Примери квартила. Опоравак од: математицас10.нет.
- Левин, Р. 1988. Статистика за администраторе. 2нд. Едитион. Прентице Халл.
- Валполе, Р. 2007. Вероватноћа и статистика за инжењерство и науке. Пеарсон.