U statističkoj analizi varijacija među članovima skupa podataka pokazuje koliko su udaljene točke podataka od linije trenda, također poznate kao a linija regresije, Što je veća varijacija, to su točke podataka raširenije. Proučavanje analize varijance pokazuje koji se dijelovi varijance mogu objasniti karakteristikama podataka, a koji se mogu pripisati slučajnim faktorima. Dio varijance koji se ne može objasniti naziva se rezidualna varijacija.
Korištenje programa Excel Spreadsheets za izračunavanje preostale odstupanja
Formula za izračunavanje rezidualne varijance uključuje brojne složene izračune. Za male skupove podataka, proces izračunavanja rezidualne varijance ručno može biti zamoran. Za velike skupove podataka zadatak može biti iscrpljujući. Koristeći Excelovu proračunsku tablicu, trebate samo unijeti podatkovne točke i odabrati ispravnu formulu. Program obrađuje složene izračune i donosi rezultat brzo.
Točke podataka
Otvorite novu Excelovu proračunsku tablicu i unesite podatkovne točke u dva stupca. Regresijske linije zahtijevaju da svaka podatkovna točka ima dva elementa. Statistički stručnjaci tipično označavaju ove elemente "X" i "Y". Primjerice, Generic osiguranje želi pronaći preostalu razliku u visini i težini svojih zaposlenika. X varijabla predstavlja visinu, a Y varijabla predstavlja težinu. Upišite visinu u stupac A i utege u stupac B.
Pronalaženje srednjeg
značiti predstavlja prosjek za svaki element u skupu podataka. U ovom primjeru Generic Insurance želi pronaći prosjek, standardnu devijaciju i kovarijansu od 10 visina i težina zaposlenika. Prosjek visina navedenih u stupcu A može se pronaći unosom funkcije "= AVERAGE (A1: A10)" u ćeliju F1. Prosjek težina navedenih u stupcu B može se pronaći unosom funkcije "= AVERAGE (B1: B10)" u ćeliju F3.
Pronalaženje standardnog odstupanja i kovarijance
standardna devijacija mjeri koliko su udaljene točke podataka razmaknute od srednje vrijednosti. kovarijance mjeri koliko se dva elementa točke podataka mijenjaju zajedno. Standardna devijacija visina se utvrđuje unosom funkcije "= STDEV (A1: A10)" u ćeliju F2. Standardna devijacija utega se utvrđuje unosom funkcije "= STDEV (B1: B10)" u ćeliju F4. Kovarijanca između visina i težina nalazi se unosom funkcije "= COVAR (A1: A10; B1: B10)" u ćeliju F5.
Pronalaženje linije regresije
linija regresije predstavlja linearnu funkciju koja slijedi trend točaka podataka. Formula za regresijski pravac izgleda ovako: Y = aX + b.
Korisnik može pronaći vrijednosti za "a" i "b" koristeći izračune za sredstva, standardne devijacije i kovarijance. Vrijednost za "b" predstavlja točku gdje regresijski pravac presreće Y-os. Vrijednost se može pronaći uzimanjem kovarijance i dijeljenjem kvadrata standardne devijacije X-vrijednosti. Excelova formula ide u ćeliju F6 i izgleda ovako: = F5 / F2 ^ 2.
Vrijednost za "a" predstavlja nagib regresijske linije. Excelova formula ide u ćeliju F7 i izgleda ovako: = F3-F6 * F1.
Da biste vidjeli formulu za regresijski pravac, unesite ovo povezivanje niza u ćeliju F8:
= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (ZNAK (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))
Izračunajte Y vrijednosti
Sljedeći korak uključuje izračunavanje Y-vrijednosti na regresijskom redu za dane vrijednosti X u skupu podataka. Formula za pronalaženje Y vrijednosti ide u stupac C i izgleda ovako:
= $ F 6 $ * A (i) + $ F $ 7
Gdje je A (i) vrijednost za stupac A u retku (i). Formule izgledaju ovako u proračunskoj tablici:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 x A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7, i tako dalje
Unosi u stupcu D prikazuju razlike između očekivanih i stvarnih vrijednosti za Y. Formule izgledaju ovako:
B = (i) -C (i)
Gdje su B (i) i C (i) vrijednosti u retku (i) u stupcima B i C, respektivno.
Pronalaženje rezidualne varijance
formula za rezidualnu varijancu prelazi u ćeliju F9 i izgleda ovako:
= ENT (D1: D 10) / (COUNT (D1: D 10) -2)
Gdje je SUMSQ (D1: D10) zbroj kvadrata razlika između stvarnih i očekivanih Y vrijednosti, i (COUNT (D1: D10) -2) je broj točaka podataka, minus 2 za stupnjeve slobode u podaci.