Kako odrediti vrstu distribucije vjerojatnosti za podatke

Sadržaj:

Anonim

Kada ste prikupili podatke o vašem sustavu ili procesu, sljedeći korak je odrediti koju vrstu distribucije vjerojatnosti imate. Vrste razdioba vjerojatnosti su: diskretna uniformnost, Bernoulli, binomna, negativna binomna, Poissonova, geometrijska, kontinuirana jednolična, normalna (zvonasta krivulja), eksponencijalna, gama i beta distribucija. Sužavanje čak i nekoliko s popisa mogućnosti čini određivanje koje je najbliže R kvadratu mnogo brže.

Stavke koje su vam potrebne

  • Grafički softver

  • Sredstva za izračunavanje R kvadratne vrijednosti (analiza najboljeg prianjanja)

Iscrtajte podatke za vizualni prikaz tipa podataka.

Jedan od prvih koraka u određivanju distribucije podataka - a time i tipa jednadžbe za modeliranje podataka - je isključiti ono što ne može biti. • Ako postoje bilo kakvi pikovi u skupu podataka, to ne može biti diskretna ravnomjerna raspodjela. • Ako podaci imaju više od jednog vrha, to nije Poisson ili binom. • Ako ima jednu krivulju, nema sekundarnih vrhova i ima lagani nagib na svakoj strani, to može biti Poisson ili gama distribucija. Ali to ne može biti diskretna ravnomjerna raspodjela. • Ako su podaci ravnomjerno raspodijeljeni i bez nakošenja prema jednoj strani, sigurno je isključiti gama ili Weibull distribuciju. • Ako funkcija ima ravnomjernu distribuciju ili vrhunac u sredini grafički prikazanih rezultata, to nije geometrijska distribucija ili eksponencijalna distribucija. • Ako se pojava faktora mijenja s varijablom okoliša, vjerojatno nije Poissonova distribucija.

Nakon što se tip distribucije vjerojatnosti suzio, napravite R kvadratnu analizu svake moguće vrste distribucije vjerojatnosti. Onaj s najvišom R kvadratnom vrijednošću najvjerojatnije je ispravan.

Uklonite jednu točku podataka. Zatim ponovno izračunajte R na kvadrat. Ako se ista vrsta distribucije vjerojatnosti pojavljuje kao najbliža podudarnost, onda postoji veliko povjerenje da je to ispravna distribucija vjerojatnosti koju će koristiti za skup podataka.

Savjet

  • Ako podaci pokazuju višestruke raspršenosti višestrukih pikova, moguće je da se odvijaju dva odvojena procesa ili se uzorak proizvoda miješa. Sjetite se podataka i zatim ih ponovno analizirajte.

Upozorenje

Potvrdite jednadžbe generirane prema kasnijim skupovima podataka kako biste potvrdili da je još uvijek točna za skup podataka. Moguće je da su čimbenici okoliša i procesni pomaci učinili trenutne jednadžbe i modele netočnima.

Preporučeni