Kako izračunati preostalu varijancu

Sadržaj:

Anonim

Investitori koriste modele kretanja cijena imovine kako bi predvidjeli gdje će cijena ulaganja biti u bilo kojem trenutku. Metode korištene za izradu tih predviđanja dio su polja statistike poznate kao regresijska analiza, Izračun rezidualna varijacija skupa vrijednosti je alat za regresijsku analizu koji mjeri koliko točno predviđanja modela odgovaraju stvarnim vrijednostima.

Linija regresije

linija regresije prikazuje kako se vrijednost sredstva promijenila zbog promjena u različitim varijablama. Također poznat kao a trend linija, regresijski red prikazuje "trend" cijene imovine. Linija regresije predstavljena je linearnom jednadžbom:

Y = a + bX

gdje je "Y" vrijednost imovine, "a" je konstanta, "b" je množitelj, a "X" je varijabla koja se odnosi na vrijednost imovine.

Na primjer, ako model predviđa da se kuća s jednom spavaćom sobom prodaje za 300.000 dolara, kuća s dvije spavaće sobe prodaje se za 400.000 dolara, a kuća s tri spavaće sobe prodaje se za 500.000 dolara, a regresijska linija bi izgledala ovako:

Y = 200,000 + 100,000X

gdje je "Y" prodajna cijena kuće, a "X" broj spavaćih soba.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

Scatterplot

scatterplot prikazuje točke koje predstavljaju stvarne korelacije između vrijednosti imovine i varijable. Izraz "scatterplot" dolazi od činjenice da, kada se te točke iscrtavaju na grafikonu, one izgledaju "raspršene" oko sebe, umjesto da leže savršeno na liniji regresije. Koristeći gore navedeni primjer, mogli bismo imati scatterplot s tim podatkovnim točkama:

Točka 1: 1BR prodana za 288.000 dolara

Točka 2: 1BR prodana za 315.000 dolara

Točka 3: 2BR prodana za 395.000 dolara

Točka 4: 2BR prodana za 410.000 dolara

Točka 5: 3BR prodana za 492.000 dolara

Točka 6: 3BR prodana za 507.000 dolara

Izračun preostale odstupanja

Izračun rezidualne varijance počinje s zbroj kvadrata razlike između vrijednosti imovine na regresijskom redu i svake odgovarajuće vrijednosti imovine na rasipanju.

Ovdje su prikazani kvadrati razlika:

Točka 1: 288 000 USD - 300 000 USD = (- 12 000 USD); (-12.000)2 = 144,000,000

Točka 2: 315.000 $ - 300.000 $ = (+ 15.000 USD); (15.000)2 = 225,000,000

Točka 3: 395 000 USD - 400 000 USD = (- 5 000 USD); (-5000)2 = 25,000,000

Točka 4: 410.000 $ - 400.000 USD = (10.000 USD); (10.000)2 = 100,000,000

Točka 5: 492 000 USD - 500 000 USD = (- 8 000 USD); (-8000)2 = 64,000,000

Točka 6: 507 000 USD - 500 000 USD = (+ 7 000 USD); (7000)2 = 49,000,000

Zbroj kvadrata = 607,000,000

Rezidualna varijacija se utvrđuje uzimajući zbroj kvadrata i dijeljenu s (n-2), gdje je "n" broj podatkovnih točaka na scatterplotu.

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

Koristi za rezidualnu varijansu

Dok svaka točka na scatterplot-u neće savršeno poravnati s regresijskom linijom, stabilan model će imati točke rasipanja u regularnoj distribuciji oko linije regresije. Preostala varijacija je također poznata kao "varijacija pogreške". Visoka rezidualna varijacija pokazuje da regresijski pravac u izvornom modelu može biti pogrešan. Neke funkcije proračunskih tablica mogu prikazati proces stvaranja retka regresije koji se više uklapa s podacima rasipanja.