Kói Tamás honlapja

Index PSPP-ben

Command syntacs

Először valószínűségi változók elméleti paramétereiről (átlag, szórás, medián, ferdeség, csúcsosság) és azok mintából való közelítéséről volt szó. Elmondtam, hogy az átlag statisztika elméleti szórásának közelítése a standard error of mean. Általában is a standard error a statisztika szórására egy becslés. Ehhez kötődően elmondtam a normális eloszlásra vonatkozó sigma szabályokat. Speciálisan annak valószínűsége, hogy egy normális valószínűségi változó az átlagtól legfeljeb 3 szórásnyira tér el több mint 99%-ék. Ezt használva tetszőleges statisztika becsült szórása heurisztikusan (általában nem normális eloszkásról van szó) segít a kiértékelésben.

Ezután megismerkedtünk a Command syntacs PSPP fájlal. A fenti sps kiterjesztésű fájlt megnyitottuk, a Run/All paranccsal lefuttattuk, aminek hatására egy 1-től 1000-ig egyesével lépdelő index változó keletkezett. Ezt követően a Transform/Compute Variable parancsával (0,1)-en egyenletes, standard normális és 1 várható értékű exponenciális valószínűségi változókat szimuláltunk (RV.Megfelelő Eloszlás függvények használatával). Megjegyezem, hogy a főoldalon belinklet PSPP manual-ban részletes információt találtok a beépített függvényekről. Fontos volt, hogy ha a paste gombra kattintunk az ok helyett parancsok kiadásánál, akkor egy command syntacs fájlba másolódik a parancs végrehajtódás helyett. Ezáltal lehetőség van archiválni az elvégzett munkát.

Az óra végén lekértük néhány leíró statisztikát (Analyze/Decriptives/Descriptive Statistics) a 3 szimulált változóról. Amit kiemelek az az, hogy az egyenletes és normális eloszlás ferdesége 0-nak adódott (a becsült szórást figyelembe véve kicsi volt a 0-tól való eltérés), míg az exponenciálisé pozitív lett. Mindez nem meglepő ha figyelembe vesszük, hogy a ferdeség pont azt méri, hogy mennyire szimmetrikus az eloszlás. A csúcsosságra pedig a normális eloszlásnál 0, az egyenletesnél negatív, míg az expoenciálisnak pozitív érték adódott.

Ezután az index változót létrehozó command syntacs file futtatása után kockadobást szimuláltunk (Transform/Compute Variable -ön belül az RV.Uniform(0,1) és a kerekítést végző RND() függvények segítségével). Megnéztük, hogy az 1000 kockadobásból mennyi lett az egyes értékek gyakorisága (Analyze/Descriptives/Frequencies). Feltettük azt a kérdést, hogy vajon mennyi egyenletlenséget írhatunk a véletlen rovására, mikortól kell gyanakodnunk arra, hogy esetleg a kokcadobás szimuláló algoritmusunk nem működik tökéletesen. Említettem, hogy erre a kérdésre a hipotézisvizsgálat eszközeivel lehet válaszolni.