- Како израчунати коефицијент одређивања?
- Илустративни случај
- Тумачење
- Примери
- - Пример 1
- Решење
- - Пример 2
- Решење
- - Пример 3
- Решење
- Фит упоређивање
- Закључци
- Референце
Коефицијент детерминације представља број између 0 и 1 која представља дио бодова (к, и), која прати линију регресије наступу скупа података са две променљиве.
Такође је познат као доброти способан и означен Р 2 . Да би се израчунао, узима се квоцијент између варијанције Ыи података процењених регресијским моделом и варијанције Ии података који одговарају сваком Кси података.
Р 2 = СИ / Си
Слика 1. Коефицијент корелације за четири пара података. Извор: Ф. Запата.
Ако се 100% података налази на линији регресијске функције, тада ће коефицијент одређивања бити 1.
Напротив, ако за скуп података и одређеном функцијом прилагођавања коефицијент Р 2 се испоставља једнака 0,5, онда се може рећи да је прилагођавање 50% задовољавајући или добар.
Слично томе, када регресионом моделу приноси Р 2 вредност нижа од 0.5, то значи да одабрана функција прилагођавање не прилагоди задовољавајући подацима, па је неопходно тражити другу функцију прилагођавања.
И када се коваријансе или коефицијент корелације тежи нули, онда променљиве Кс и И у подацима су неповезане, и зато Р 2 такође имају тенденцију да нулу.
Како израчунати коефицијент одређивања?
У претходном одељку је речено да се коефицијент одређивања израчунава квоцијентом између варијанци:
-Процењује се регресијском функцијом променљиве И
-Од променљиве Ии која одговара свакој од променљиве Кси од Н парова података.
Математички речено, изгледа овако:
Р 2 = СИ / Си
Из ове формуле произилази да Р 2 представља проценат варијансе објашњава регресионом моделу. Алтернативно, Р 2 може се израчунати помоћу следеће формуле, потпуно еквивалентно са претходним:
Р 2 = 1 - (Сε / Си)
Где Сε представља варијанцу резидуала εи = Ыи - Ии, док је Си варијанса скупа вредности Ии података. Да би се утврдило Ыи примењује се регресијска функција, што значи да се потврђује да је Ыи = ф (Кси).
Варијанта скупа података Ии, са и од 1 до Н, израчунава се на овај начин:
Си =
Затим наставите на сличан начин за Сы или Сε.
Илустративни случај
Да бисмо показали детаље како се израчунава коефицијент одређивања, узећемо следећи скуп од четири пара података:
(Кс, И): {(1, 1); (2. 3); (3, 6) и (4, 7)}.
За овај скуп података је предложен линеарни регресијски ставак који се добија методом најмање квадрата:
ф (к) = 2,1 к - 1
Применом ове функције подешавања, обртни моменти се добијају:
(Кс, Ы): {(1, 1.1); (2, 3.2); (3, 5.3) и (4, 7.4)}.
Затим израчунавамо аритметичку средину за Кс и И:
Варианце Си
Си = / (4-1) =
= = 7.583
Варијанца Сы
Сы = / (4-1) =
= = 7,35
Коефицијент одређивања Р 2
Р 2 = СИ / Си = 7.35 / 7.58 = 0.97
Тумачење
Коефицијент одређивања за илустративни случај разматран у претходном сегменту показао се 0,98. Другим речима, линеарно подешавање преко функције:
ф (к) = 2.1к - 1
Има 98% поузданости у објашњавању података са којима је добијен методом најмање квадрата.
Поред коефицијента одређивања, постоји и коефицијент линеарне корелације или познат и као Пеарсонов коефицијент. Овај коефицијент, означен као р, израчунава се према следећем односу:
р = Ски / (Ск Си)
Овде бројач представља коваријанс између варијабли Кс и И, док је називник производ стандардног одступања за променљиву Кс и стандардног одступања за променљиву И.
Пеарсонов коефицијент може примити вриједности између -1 и +1. Када овај коефицијент тежи +1, постоји директна линеарна корелација између Кс и И. Ако уместо тога има -1, постоји линеарна корелација, али када Кс расте И опада. Коначно, близу је 0 и нема корелације између две варијабле.
Треба напоменути да се коефицијент одређивања подудара с квадратом Пеарсоновог коефицијента, само кад је први израчунат на основу линеарног стајања, али та једнакост не важи за остале нелинеарне уклапања.
Примери
- Пример 1
Група средњошколаца одредила је емпиријски закон за период клатна као функцију његове дужине. Да би постигли овај циљ, они врше низ мерења у којима мере време њихања клатна различите дужине, добијајући следеће вредности:
Дужина (м) | Период (и) |
---|---|
0.1 | 0.6 |
0,4 | 1.31 |
0.7 | 1.78 |
једно | 1.93 |
1.3 | 2.19 |
1.6 | 2.66 |
1.9 | 2.77 |
3 | 3.62 |
Од њега се тражи да се направи расипање графикона података и изврши линеарно прилагођавање путем регресије. Такође, покажите једнаџбу регресије и њен коефицијент одређивања.
Решење
Слика 2. Графикон решења за вежбу 1. Извор: Ф. Запата.
Може се приметити прилично висок коефицијент одређивања (95%), па би се могло помислити да је линеарно уклапање оптимално. Међутим, ако се тачке посматрају заједно, изгледа да имају тенденцију да се окрећу према доле. О овом детаљу се не размишља у линеарном моделу.
- Пример 2
За исте податке у примјеру 1, направите распоред распршивања података. Том приликом, за разлику од примера 1, захтева се регресијско прилагођавање помоћу потенцијалне функције.
Слика 3. Графикон решења за вежбу 2. Извор: Ф. Запата.
Показују и фит функције и њеног коефицијент детерминације Р 2 .
Решење
Потенцијална функција је облика ф (к) = Ак Б , где су А и Б константе које су одређене методом најмање квадрата.
Претходна слика приказује потенцијалну функцију и њене параметре, као и коефицијент детерминације са врло високом вредношћу од 99%. Примјетите да подаци прате закривљеност линије тренда.
- Пример 3
Користећи исте податке из примера 1 и примера 2, изведите полином другог степена. Показују графикона, фит полинома, и одговарајући коефицијент детерминације Р 2 .
Решење
Слика 4. Графикон решења за вежбу 3. Извор: Ф. Запата.
Са полиномом другог степена можете видети линију тренда која се добро уклапа у закривљеност података. Такође, коефицијент одређивања је изнад линеарног стајања и испод потенцијалног фитања.
Фит упоређивање
Од три приказана подударања, онај с највишим коефицијентом одређивања је потенцијално прилегање (пример 2).
Потенцијално подударање коинцидира с физичком теоријом клатна, која, као што је познато, утврђује да је период клатна пропорционалан квадратном корену његове дужине, при чему је константа пропорционалности 2π / √г, где је г убрзање гравитације.
Ова врста поклапања потенцијала не само да има највећи коефицијент одређивања, већ и експонент и константа пропорционалности одговарају физичком моделу.
Закључци
- Подешавање регресије одређује параметре функције која има за циљ да објасни податке користећи методу најмање квадрата. Ова метода се састоји од минимизирања зброја квадратне разлике између подешавања И вриједности и Ии вриједности података за Кси вриједности података. Ово одређује параметре функције подешавања.
-Као што смо видели, најчешћа функција прилагођавања је линија, али није једина, јер подешавања могу бити и полиномна, потенцијална, експоненцијална, логаритамска и друга.
-У сваком случају, коефицијент одређивања зависи од података и врсте подешавања и показатељ је доброте примењеног подешавања.
-На крају, коефицијент одређивања означава проценат укупне променљивости између вредности И података у односу на то вредност прилагођавања за Кс дан.
Референце
- Гонзалез Ц. Општа статистика. Опоравак од: тарви.ламолина.еду.пе
- ИАЦС. Арагонски институт наука о здрављу. Опоравак од: ицс-арагон.цом
- Салазар Ц. и Цастилло С. Основни принципи статистике. (2018). Опоравак од: дспаце.уце.еду.ец
- Суперпроф. Коефицијент одређивања. Опоравак од: суперпроф.ес
- УСАЦ. Описни приручник за статистику. (2011). Опоравак од: статистицс.ингениериа.усац.еду.гт.
- Википедиа. Коефицијент одређивања. Опоравак од: ес.википедиа.цом.