- Формуле и једначине
- Како израчунати грешку узорковања
- За ниво самопоуздања
- Примери
- - Пример 1
- Решење
- - Пример 2
- Решење
- - Пример 3
- Решење
- - Пример 4
- Решење
- - Вежба 5
- Решење
- Референце
Узорковања грешка или узорковања грешка у статистици је разлика између средње вредности узорка и средње вредности укупног становништва. Да илуструјемо идеју, замислимо да укупно становништво града износи милион људи, од чега желите просечну величину ципела за коју се узима случајни узорак од хиљаду људи.
Просјечна величина која излази из узорка неће се нужно подударати с величином укупне популације, мада ако узорак није пристран, вриједност мора бити близу. Ова разлика између средње вредности узорка и укупне популације представља грешку узорковања.
Слика 1. Пошто је узорак подскупина укупне популације, просечна вредност узорка има грешку. Извор: Ф. Запата.
Опћенито, средња вриједност укупне популације није позната, али постоје технике за смањење ове грешке и формуле за процјену маргине узорковања која ће се расправљати у овом чланку.
Формуле и једначине
Рецимо да желимо знати средњу вриједност одређене мјерљиве карактеристике к у популацији величине Н, али пошто је Н велики број, није изведиво спровести истраживање о укупној популацији, а затим настављамо са случајним узорком величина н <
Средња вредност узорка означена је са
Претпоставимо да су узети м узорци из укупне популације Н, сви једнаке величине н са средњим вредностима
Те средње вредности неће бити идентичне једна другој и све ће бити око просечне вредности популације μ. Граница грешке узорковања Е означава очекивано одвајање средњих вредности
Стандардна маргина грешке ε узорка величине н је:
ε = σ / √н
где је σ стандардна девијација (квадратни корен варијансе), која се израчунава следећом формулом:
σ = √
Значење стандардне маргине грешке ε је следеће:
Средња вредност
Како израчунати грешку узорковања
У претходном одељку дата је формула за проналажење стандардне границе грешке узорка величине н, где реч стандард означава да је грешка грешке са 68% поузданости.
Ово указује да ће, ако је узето више узорака исте величине н, 68% дати средње вредности
Постоји једноставно правило, звано правило 68-95-99.7, које нам омогућава да лако пронађемо граничну грешку узорковања за нивое поузданости од 68%, 95% и 99.7%, будући да је та маржа 1⋅ ε, 2 ⋅ ε и 3⋅ ε.
За ниво самопоуздања
Ако ниво поузданости γ није један од горе наведеног, тада је грешка узорковања стандардна девијација σ помножена са фактором Зγ, који се добија следећим поступком:
1.- Прво се одређује ниво значајности α који се израчунава од нивоа поузданости γ путем следећег односа: α = 1 - γ
2.- Затим морамо израчунати вредност 1 - α / 2 = (1 + γ) / 2, која одговара акумулираној нормалној фреквенцији између -∞ и Зγ, у нормалној или Гауссовој дистрибуцији типизираној Ф (з), чија дефиниција може се видети на слици 2.
3. - Једнаџба Ф (Зγ) = 1 - α / 2 решава се помоћу табела нормалне дистрибуције (кумулативне) Ф, или помоћу рачунарске апликације која има обрнуту Гауссову функцију Ф -1 .
У последњем случају имамо:
Зγ = Г -1 (1 - α / 2).
4.- Коначно, ова формула се примењује за грешку узорковања са нивоом поузданости γ:
Е = Зγ ⋅ (σ / √н)
Слика 2. Табела нормалне дистрибуције. Извор: Викимедиа Цоммонс.
Примери
- Пример 1
Израчунајте стандардну границу грешке у средњој тежини узорка од 100 новорођенчади. Израчун просечне тежине је био
Решење
Стандардна грешка је ε = σ / √н = (1.500 кг) / √100 = 0.15 кг. То значи да се из ових података може закључити да је тежина 68% новорођенчади између 1.950 кг и 3.25 кг.
- Пример 2
Одредите границу грешке узорковања Е и распон масе 100 новорођенчади са 95% нивоом поузданости ако је средња тежина 3.100 кг са стандардним одступањем σ = 1.500 кг.
Решење
Ако се примењује правило 68; 95; 99,7 → 1 ε; 2⋅ ε; 3 ε, имамо:
Е = 2⋅ε = 2,105 кг = 0,30 кг
Другим речима, 95% новорођенчади имаће тежину између 2.800 кг и 3.400 кг.
- Пример 3
Одредите распон тежине новорођенчади у Примеру 1 са 99,7-постотном поузданошћу.
Решење
Погрешка узорковања са поузданошћу од 99,7% је 3 σ / √н, што је за наш пример Е = 3 * 0,15 кг = 0,45 кг. Одавде слиједи да ће 99,7% новорођенчади имати тежину између 2.650 и 3.550 кг.
- Пример 4
Одредите фактор Зγ за ниво поузданости од 75%. Одредите маргину грешке узорковања са овим нивоом поузданости за случај представљен у Примеру 1.
Решење
Ниво поузданости је γ = 75% = 0,75, што се односи на ниво значајности α кроз однос γ = (1 - α), тако да је ниво значајности α = 1 - 0,75 = 0 , 25.
То значи да је кумулативна нормална вероватноћа између -∞ и Зγ:
П (З ≤ Зγ) = 1 - 0,125 = 0,875
Што одговара вредности Зγ од 1.1503, као што је приказано на слици 3.
Слика 3. Одређивање Зγ фактора који одговара нивоу поузданости од 75%. Извор: Ф. Запата кроз Геогебру.
Другим речима, грешка узорковања је Е = Зγ ⋅ (σ / √н) = 1,15 ⋅ (σ / √н).
Када се примењује на податке из примера 1, даје грешку:
Е = 1,15 * 0,15 кг = 0,17 кг
Са нивоом поузданости од 75%.
- Вежба 5
Колики је ниво поузданости ако је З α / 2 = 2,4?
Решење
П (З ≤ З α / 2 ) = 1 - α / 2
П (З ≤ 2.4) = 1 - α / 2 = 0.9918 → α / 2 = 1 - 0.9918 = 0.0082 → α = 0.0164
Ниво значајности је:
α = 0,0164 = 1,64%
И на крају, ниво поверења остаје:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Референце
- Цанавос, Г. 1988. Вероватноћа и статистика: Примене и методе. МцГрав Хилл.
- Деворе, Ј. 2012. Вероватноћа и статистика за инжењерство и науку. 8тх. Едитион. Ценгаге.
- Левин, Р. 1988. Статистика за администраторе. 2нд. Едитион. Прентице Халл.
- Судман, С. 1982. Постављање питања: Практични водич за дизајн упитника. Сан Франциско. Јоссеи Басс.
- Валполе, Р. 2007. Вероватноћа и статистика за инжењерство и науке. Пеарсон.
- Воннацотт, ТХ и РЈ Воннацотт. 1990. Уводна статистика. 5. издање Вилеи
- Википедиа. Грешка узорковања. Опоравак од: ен.википедиа.цом
- Википедиа. Граница грешке. Опоравак од: ен.википедиа.цом