- Формуле и једначине
- Важне статистичке променљиве
- Модел и својства
- Главна својства хипергеометријске дистрибуције
- Приближавање употребом биномне дистрибуције
- Пример 2
- Решене вежбе
- Вежба 1
- Решење
- Вежба 2
- Решење
- Вежба 3
- Решење за
- Решење ц
- Референце
Гипергеометрические Дистрибуција је дискретна статистичка функција погодна за израчунавање вероватноће у рандомизираних експериментима са два могућа исхода. Услов који се тражи да се примени је да су то мале популације у којима се повлачења не замењују и вероватноће нису константне.
Стога, када се изабере елемент популације који ће знати резултат (истинит или лажан) одређене карактеристике, тај исти елемент се не може поново бирати.
Слика 1. У овој популацији болта сигурно има неисправних узорака. Извор: Пикабаи.
Дакако, вјероватно је да ће сљедећи одабрани елемент добити истински резултат, ако је претходни елемент имао негативан резултат. То значи да вероватноћа варира како се елементи узимају из узорка.
Главне примене хипергеометријске дистрибуције су: контрола квалитета у процесима са мало популације и израчунавање вероватноће у играма на срећу.
Што се тиче математичке функције која дефинише хипергеометријску дистрибуцију, она се састоји од три параметра који су:
- Број елемената популације (Н)
- Величина узорка (м)
- Број догађаја у целој популацији са повољним (или неповољним) резултатом проучаване карактеристике (н).
Формуле и једначине
Формула хипергеометријске дистрибуције даје вероватноћу П да се могу догодити к повољни случајеви одређене карактеристике. Начин математичког писања на основу комбинаторних бројева је:
У претходном изразу Н, н и м су параметри, а к је сама променљива.
- Укупан број становника је Н.
- Број позитивних резултата одређене бинарне карактеристике у односу на укупну популацију је н.
-Квалитет елемената у узорку је м.
У овом случају, Кс је случајна променљива која узима вредност к, а П (к) указује на вероватноћу појављивања к повољних случајева испитиване карактеристике.
Важне статистичке променљиве
Остале статистичке променљиве за хипергеометријску дистрибуцију су:
- Средње μ = м * н / Н
- Варијанта σ ^ 2 = м * (н / Н) * (1-н / Н) * (Нм) / (Н-1)
- Стандардна девијација σ која је квадратни корен варијансе.
Модел и својства
Да бисмо дошли до модела хипергеометријске дистрибуције, полазимо од вероватноће добијања к повољних случајева у узорку величине м. Овај узорак садржи елементе који су у складу са својством која се проучава и елементе који не.
Подсетимо се да н представља број повољних случајева у укупној популацији Н елемената. Тада би се вероватноћа израчунала овако:
Изражавајући горе наведено у облику комбинаторних бројева, постиже се сљедећи модел расподјеле вјероватноће:
Главна својства хипергеометријске дистрибуције
Они су следећи:
- Узорак увек мора бити мали, чак и ако је популација велика.
- Елементи узорка се издвајају један по један, без укључивања натраг у популацију.
- Својство које се проучава је бинарно, то јест може имати само две вредности: 1 или 0, или истинито или лажно.
У сваком кораку вађења елемената вероватноћа се мења у зависности од претходних резултата.
Приближавање употребом биномне дистрибуције
Још једно својство хипергеометријске дистрибуције је да се она може апроксимирати биномном расподјелом, означеном Би, све док је популација Н велика и најмање 10 пута већа од узорка м. У овом случају би изгледало овако:
Вероватноћа да су к = 3 завртња у узорку неисправна је: П (500, 5, 60, 3) = 0,0129.
Са своје стране, вероватноћа да је к = 4 завртња од шездесет узорка неисправна је: П (500, 5, 60; 4) = 0,0008.
Коначно, вероватноћа да су к = 5 шрафова у том узорку неисправна је: П (500, 5, 60; 5) = 0.
Али ако желите знати колика је вјероватноћа да у том узорку има више од 3 неисправна завртња, тада морате добити кумулативну вјероватност додајући:
Овај пример је илустрован на слици 2, добијеној употребом ГеоГебре, бесплатног софтвера који се широко користи у школама, институтима и универзитетима.
Слика 2. Пример хипергеометријске дистрибуције. Припремио Ф. Запата са ГеоГебром.
Пример 2
Шпанска палуба има 40 карата, од којих 10 има злато, а преосталих 30 нема. Претпоставимо да се из те палубе насумично извлачи 7 карата које нису поново укључене у шпил.
Ако је Кс број злата присутних на извучених 7 карата, вероватноћа да ћете имати к злата у извлачењу са 7 карата дата је хипергеометријском дистрибуцијом П (40,10,7; к).
Да видимо овако: да бисмо израчунали вероватноћу да у цртежу са 7 карата имамо 4 злата, користимо формулу хипергеометријске дистрибуције са следећим вредностима:
А резултат је: 4,57% вероватноће.
Али ако желите знати колико је вјероватно да ћете добити више од 4 картице, тада морате додати:
Решене вежбе
Следећи скуп вежби има за циљ да илуструје и асимилира концепте који су представљени у овом чланку. Важно је да их читалац покуша разрешити сам, пре него што погледа решење.
Вежба 1
Фабрика кондома открила је да је на сваких 1000 кондома произведених на одређеној машини 5 неисправних. За контролу квалитета, насумично се узме 100 кондома, а партија се одбије ако постоји барем један или више неисправних. Одговор:
а) Која је могућност да ће пуно 100 бити одбачено?
б) Да ли је овај критеријум контроле квалитета ефикасан?
Решење
У овом случају ће се појавити врло велики комбинаторички бројеви. Прорачун је тежак, осим ако немате одговарајући софтверски пакет.
Али пошто је то велика популација и узорак је десет пута мањи од укупне популације, могуће је користити апроксимацију хипергеометријске дистрибуције биномном дистрибуцијом:
У горњем изразу Ц (100, к) је комбинаторни број. Тада ће се вјероватност појављивања више од једног дефекта израчунати овако:
То је одлична апроксимација, ако се упореди са вредностом добијеном применом хипергеометријске дистрибуције: 0.4102
Може се рећи да с 40% вероватноће треба одбацити серију од 100 профилактичких лекова, што није баш ефикасно.
Али, ако бисте били мало мање захтевни у процесу контроле квалитета и одбацили серију 100 само ако постоје два или више недостатака, вероватноћа да ће се серија одбацити пала би на само 8%.
Вежба 2
Машина од пластичних блокова делује на такав начин да се на сваких 10 комада један деформише. У узорку од 5 комада, колико је вероватно да је само један комад неисправан?
Решење
Становништво: Н = 10
Број н кварова за свако Н: н = 1
Величина узорка: м = 5
Стога постоји 50% вероватноћа да ће се у узорку од 5 деформисати блок.
Вежба 3
На састанку младих матураната долази 7 дама и 6 господе. Међу девојчицама 4 студије хуманистичких наука и 3 науке. У дечачкој групи 1 студија је хуманистичких наука и 5 наука. Израчунајте следеће:
а) Насумично бирање три девојке: колико је вероватно да све проучавају хуманистичке знаности?
б) Ако се насумично изаберу три учесника састанка пријатеља: Која је могућност да њих троје, без обзира на пол, проуче науку сва три или хуманистичке науке такође све три?
ц) Сада одаберите насумично два пријатеља и назовите к случајну променљиву „број оних који проучавају хуманистичке науке“. Између два изабрана, одредите средњу или очекивану вредност к и варијанцу σ ^ 2.
Решење за
Вриједности које сада треба користити су:
-Полиција: Н = 14
-Квалитета која проучава слова је: н = 6 и
- Величина узорка: м = 3.
-Број пријатеља који проучавају хуманистичке науке: к
Према овом, к = 3 значи да све три проучавају хуманистичке науке, али к = 0 значи да ниједна не проучава хуманистичке знаности. Вероватноћа да сва тројица проучавају исто дато је збиром:
П (14, 6, 3, к = 0) + П (14, 6, 3, к = 3) = 0,0560 + 0,1539 = 0,2099
Тада имамо 21% вероватноће да ће три учесника састанка, изабрана насумично, проучити исту ствар.
Решење ц
Овде имамо следеће вредности:
Н = 14 укупна популација пријатеља, н = 6 укупан број у популацији која проучава хуманистичке знаности, величина узорка је м = 2.
Нада је:
Е (к) = м * (н / Н) = 2 * (6/14) = 0,8572
И варијанца:
σ (к) ^ 2 = м * (н / Н) * (1-н / Н) * (Нм) / (Н-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Референце
- Дискретне дистрибуције вероватноће. Опоравак од: биплот.усал.ес
- Статистика и вероватноћа. Хипергеометријска дистрибуција. Опоравак од: пројецтдесцартес.орг
- ЦДПИЕ-УГР. Хипергеометријска дистрибуција. Опоравак од: угр.ес
- Геогебра. Класична геогебра, вјероватно рачунање. Опоравак са геогебра.орг
- Пробајте лако. Решени проблеми хипергеометријске дистрибуције. Опоравак од: пробафацил.цом
- Минитаб. Хипергеометријска дистрибуција. Опоравак од: суппорт.минитаб.цом
- Универзитет у Вигу. Главне дискретне дистрибуције. Опоравак од: анапг.вебс.увиго.ес
- Витутор. Статистика и комбинаторика. Опоравак од: витутор.нет
- Веисстеин, Ериц В. Хипергеометријска дистрибуција. Опоравак од: матхворлд.волфрам.цом
- Википедиа. Хипергеометријска дистрибуција. Опоравак од: ес.википедиа.цом