- Формула
- Карактеристике нормалне дистрибуције
- Интервали поверења
- Примене нормалне дистрибуције
- Пример
- Вежба решена
- Референце
Нормална расподела или Гаусова расподела је дистрибуција вероватноће у континуалне промјенљиве, у којој је функција густине вероватноће описали експоненцијалном функцијом квадратне и негативног аргумент, који изазива облику звона.
Назив нормалне дистрибуције долази од чињенице да је та дистрибуција она која се односи на највећи број ситуација у којима је нека континуирана случајна варијабла укључена у одређену групу или популацију.
Слика 1. Нормална дистрибуција Н (к; µ, σ) и њена густина вероватноће ф (с; µ, σ). (Властита обрада)
Примери где се примењује нормална дистрибуција су: висина мушкараца или жена, одступања у мери неке физичке величине или у мерљивим психолошким или социолошким особинама, као што су интелектуални квоцијент или потрошачке навике одређеног производа.
С друге стране, назива се Гаусова дистрибуција или Гауссово звоно, јер је тај немачки математички гениј заслужан за своје откриће за употребу коју му је дао да опише статистичку грешку астрономских мерења још у 1800. години.
Међутим, наводи се да је ову статистичку дистрибуцију претходно објавио други велики математичар француског порекла, попут Абрахам де Моивре, још 1733. године.
Формула
Функција нормалне дистрибуције у непрекидној променљивој к, са параметрима μ и σ, означава се са:
Н (к; µ, σ)
и изричито је написано овако:
Н (к; µ, σ) = ∫ -∞ к ф (с; µ, σ) дс
где је ф (у; μ, σ) функција густине вероватноће:
ф (с; μ, σ) = (1 / (σ√ (2π)) Екп (- с 2 / (2σ 2 ))
Константа која множи експоненцијалну функцију у функцији густине вероватноће назива се константа нормализације и изабрана је на тај начин да:
Н (+ ∞, μ, σ) = 1
Претходни израз осигурава да је вероватноћа да је случајна променљива к између -∞ и + ∞ једнака, односно 100% вероватноћа.
Параметар μ је аритметичка средина континуиране случајне променљиве к и σ стандардне девијације или квадратни корен варијанце исте исте променљиве. У случају да је μ = 0 и σ = 1, тада имамо стандардну нормалну дистрибуцију или типичну нормалну дистрибуцију:
Н (к; μ = 0, σ = 1)
Карактеристике нормалне дистрибуције
1- Ако случајна статистичка варијабла следи нормалну расподелу густине вероватноће ф (с; μ, σ), већина података је груписана око средње вредности μ и раштркана је око ње на тај начин да је мало више од ⅔ података је између μ - σ и μ + σ.
2- Стандардна девијација σ је увек позитивна.
3- Облик функције густине ф сличан је облику звона, због чега се ова функција често назива Гауссово звоно или Гауссова функција.
4- У Гауссовој дистрибуцији средња вредност, средња средина и начин рада се подударају.
5- Тачке прегиба функције густине вероватноће тачно су на μ - σ и μ + σ.
6- Функција ф је симетрична у односу на осовину која пролази кроз њену средњу вредност μ и има асимптотички нулу за к ⟶ + ∞ и к ⟶ -∞.
7- Што је већа вредност σ, већа је дисперзија, бука или удаљеност података око средње вредности. Другим речима, већи σ облик звона је отворенији. С друге стране, σ мала означава да су коцкице близу средње вриједности, а облик звона је затворенији или шиљастији.
8- Функција расподјеле Н (к; μ, σ) указује на вјероватност да је случајна варијабла мања или једнака к. На пример, на слици 1 (горе) вероватноћа П да је променљива к мања или једнака 1,5 износи 84% и одговара површини под функцијом густине вероватноће ф (к; μ, σ) од -∞ до к
Интервали поверења
9- Ако подаци прате нормалну дистрибуцију, тада је 68,26% између μ - σ и μ + σ.
10- 95.44% података који слиједе нормалну дистрибуцију је између μ - 2σ и μ + 2σ.
11- 99.74% података који прате нормалну дистрибуцију је између μ - 3σ и μ + 3σ.
12- Ако случајна променљива к следи дистрибуцију Н (к; μ, σ), онда променљива
з = (к - μ) / σ следи стандардну нормалну дистрибуцију Н (з; 0,1).
Промена променљиве к у з назива се стандардизацијом или куцањем и веома је корисна када применимо табеле стандардне дистрибуције на податке који следе нестандардну нормалну дистрибуцију.
Примене нормалне дистрибуције
Да би се примијенила нормална дистрибуција, потребно је проћи кроз израчун интеграл густине вјероватности, што с аналитичког становишта није лако и не постоји увијек рачунарски програм који омогућава његово нумеричко израчунавање. У ту сврху користе се табеле нормализованих или стандардизованих вредности, а то је ништа више од нормалне дистрибуције у случају μ = 0 и σ = 1.
Стандардизована табела нормалне дистрибуције (део 1/2)
Стандардизована табела нормалне дистрибуције (део 2/2)
Треба напоменути да ове табеле не укључују негативне вредности. Међутим, користећи својства симетрије функције Гауссове густине вероватноће могу се добити одговарајуће вредности. Решена вежба приказана доле указује на употребу табеле у тим случајевима.
Пример
Претпоставимо да имате скуп случајних података к који прате нормалну дистрибуцију средњег 10 и стандардне девијације 2. Од вас се тражи да пронађете вероватноћу да:
а) Насумична варијабла к је мања или једнака 8.
б) је мањи или једнак 10.
ц) да је променљива к испод 12.
д) Вероватноћа да је к вредност између 8 и 12.
Решење:
а) Да бисте одговорили на прво питање, једноставно морате израчунати:
Н (к; µ, σ)
Са к = 8, μ = 10 и σ = 2. Схватамо да је то интеграл који нема аналитичко решење у елементарним функцијама, али је решење изражено функцијом функције грешке ерф (к).
С друге стране, постоји могућност решавања интеграла у нумеричком облику, што раде многи калкулатори, прорачунске табеле и рачунарски програми попут ГеоГебре. Следећа слика приказује нумеричко решење које одговара првом случају:
Слика 2. Густина вероватноће ф (к; μ, σ). Осјенчана област представља П (к ≤ 8). (Властита обрада)
а одговор је да је вероватноћа да је к испод 8 следећа:
П (к ≤ 8) = Н (к = 8; μ = 10, σ = 2) = 0,1587
б) У овом случају покушавамо да нађемо вероватноћу да је случајна променљива к испод средње вредности, што у овом случају вреди 10. Одговор не захтева никакво израчунавање, јер знамо да је половина података испод просек, а друга половина изнад просека. Стога је одговор следећи:
П (к ≤ 10) = Н (к = 10; µ = 10, σ = 2) = 0,5
ц) Да бисмо одговорили на ово питање, морамо израчунати Н (к = 12; μ = 10, σ = 2), што се може учинити помоћу калкулатора који има статистичке функције или помоћу софтвера као што је ГеоГебра:
Слика 3. Густина вероватноће ф (к; μ, σ). Осјенчана област представља П (к ≤ 12). (Властита обрада)
Одговор на део ц може се видети на слици 3 и гласи:
П (к ≤ 12) = Н (к = 12; μ = 10, σ = 2) = 0,8413.
д) Да бисмо пронашли вероватноћу да је случајна променљива к између 8 и 12, можемо да добијемо резултате делова а и ц на следећи начин:
П (8 ≤ к ≤ 12) = П (к ≤ 12) - П (к ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Вежба решена
Просечна цена акција компаније је 25 долара са стандардним одступањем од 4 долара. Одредите вероватноћу да:
а) Акција кошта мање од 20 УСД.
б) То кошта више од 30 УСД.
ц) Цена је између 20 и 30 долара.
За проналажење одговора користите стандардне нормалне табеле дистрибуције.
Решење:
Да бисте искористили табеле, потребно је прећи на нормализовану или откучану з променљиву:
$ 20 у нормализованој варијабли је једнако з = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 и
$ 30 у нормализованој варијабли је з = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.
а) $ 20 је једнака -1,25 у нормализованој варијабли, али табела нема негативне вредности, па постављамо вредност +1,25 која даје вредност 0,8944.
Ако се од ове вредности одузме 0,5, резултат ће бити површина између 0 и 1,25 која је, узгред, идентична (по симетрији) подручју између -1,25 и 0. Резултат одузимања је 0,8944 - 0,5 = 0,3944 што је површина између -1,25 и 0.
Али занимљиво је подручје од -∞ до -1,25, што ће бити 0,5 - 0,3944 = 0,1056. Стога је закључено да је вероватноћа да је акција испод 20 долара 10,56%.
б) $ 30 у откуцаној варијабли з је 1,25. За ову вредност у табели је приказан број 0,8944, што одговара подручју од -∞ до +1,25. Подручје између +1,25 и + ∞ је (1 - 0,8944) = 0,1056. Другим речима, вероватноћа да једна акција кошта више од 30 УСД износи 10,56%.
ц) Вероватноћа да акција има трошкове између 20 и 30 долара израчунава се на следећи начин:
100% -10,56% - 10,56% = 78,88%
Референце
- Статистика и вероватноћа. Нормална расподела. Опоравак од: пројецтдесцартес.орг
- Геогебра. Класична геогебра, вјероватно рачунање. Опоравак са геогебра.орг
- МатхВоркс. Гауссова дистрибуција. Опоравак од: ес.матхворкс.цом
- Менденхалл, В. 1981. Статистика за менаџмент и економију. 3рд. издање. Групо уредништво Ибероамерица.
- Стат Трек. Научите себе статистику. Поиссон Дистрибутион. Опоравак од: статтрек.цом,
- Триола, М. 2012. Основна статистика. 11тх. Ед. Пеарсон Едуцатион.
- Универзитет у Вигу. Главне континуиране дистрибуције. Опоравак од: анапг.вебс.увиго.ес
- Википедиа. Нормална расподела. Опоравак од: ес.википедиа.орг