A fent belinkelt koleszterines adatfile-al foglalkoztunk. Két letölthető verzió is van, az elsőt töltöttük le, és a második formátumára alakítottuk (így a kontroll csoport eredményeit is meg tudtuk tartani). Az átalakítást a command syntacs-ban használható "If valtozo1=valami ujvaltozo=valamimas." parancs használatával és aggregálással oldottuk meg. Felül a különböző stádiumban levő átalakított PSPP file-ok is letölthetőek.
Három kérdést tettünk fel ehhez az adatfile-hoz kötődően. Egy általunk gondolt konkrét értéknek (nem emlékszem, hogy pontosan melyik értéket teszteltük) tekinthető-e a szívrohamon átesettek koleszterin szintjének várható értéke a szívroham után 2 nappal? Különbözik a szívrohamon átesettek 2. és 14. napi koleszterintje? Különbözik a szívrohamon átesettek 14. napi és az egészségesek koleszterinszintje?
Az első kérdést egymintás kétoldali t-próbával, a másodikat összetartozó kétmintás kétoldali t-próbával míg a harmadikat független kétmintás kétoldali t-próbával válaszoltuk meg első körben.
A hipotézisvizsgálat lényegét és PSPP-ben való kiértékelését az egymintás kétoldali t-próba kapcsán tanítottam meg. Általánosabb nézőpontból a teszt működése a következő. A független minták függvényeként kiszámolunk egy S statisztikát (S csak egy jelölés). Ez egy valószínűségi változó. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (itt most n-1 szabadsági fokú student t eloszlás). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy S odaesik 95% legyen (ha 95%-os szignifikancia szinten dolgozva). Ezzel az elsőfajú hibát 5%-ra állítottuk be. Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét tesztnél azt jelenti, hogy a felvett intervallum szimmetrikus a 0-ra. Ekkor a tesztünk a következő: ha S beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Két fontos tulajdonságra hívtam fel a figyelmeteket. Rögzített mintaszámnál ha csökkentjük az elsőfajú hibát, akkor nő a másodfajú és viszont. A másik fontos dolog, hogy rögzített elsőfajú hiba mellett, tetszőleges ellenhipotézisbeli eloszlás esetén a másodfajú hiba 0-hoz tart ha a mintaelemszám végtelenhez tart (konzisztens a teszt). Ezt követően rátértem arra, hogy hogyan kell kiértékelni PSPP-ben. A PSPP azt csinálja, hogy egy konkrét statisztikára megkeresi azt az elsőfajú hibát, amelyen épp határon van a nullhipotézis elfogadása és elutasítása, ezt én p értéknek nevezem, a PSPP sig. jelzés alá írja ki. Így ha 5%-os elsőfajú hibával dolgozunk (95%-os szignifikanciával), akkor ha a PSPP 0,05 alatti p-értéket ír ki, akkor elutasítjuk a nullhipotézist, ha nagyobbat akkor elfogadjuk.
A fentiek alapján (és az órai bővebb magyarázat alapján) ha egy statisztikai tesztről megmondom, hogy milyen feltételek mellett lehet használni, mi a nullhipotézis és mi az ellenhipotézis, akkor az elég információ ahhoz, hogy az PSPP-ben ezt a tesztet lefuttassátok és kiértékeljétek.
Ezután a tanultakat használva az Analyze/Compare Means/One Sample t-test paranccsal megvizsgáltuk, hogy a betegek 2. napi koleszterinjének átlaga tekinthető-e az általunk gondoltnak. Fontos volt, hogy a Data/Select Cases menüjével rá kellett fókuszálnunk a betegek csoportjára.
Ezt követően elmondtam nektek az összetartozó és független kétmintás t-próbákat. Fontos, hogy az összetartozó kétmintás t-próba egyszerűen a különbségváltozóra futtatott, annak 0 várható értékűségét tesztelő egymintás kétoldali t-próba. Majd az Analyze/Compare means fülön belül a Paired Sample t-test menüvel megvizsgáltuk, hogy a betegek 2. és 14. napi koleszterinje különbözik-e. 95%-os szignifikanciával dolgozva elutasítottuk a várható értékek azonosságát állító nullhipotézist. Az átlagokat is megvizsgálva mondhatjuk, hogy csökkent a betegek koleszterin értéke a 14. napra. Fontos volt, hogy itt is kellett használnunk a Data/Select Cases parancsot. Ezután az Independent sample t test paranccsal megnéztük, hogy az egészégesek koleszterin értékei különböznek-e a szívrohamon átesettek 14. napi koleszterinjétől (itt vissza kellett kapcsolni a Data/Select Cases-ben az összes esetet). Mondtam, hogy a tesztet úgy kell kiértékelni, hogy először meg kell nézni az F próbát, aminek az a nullhipotézise, hogy a két csoport szórása azonos, ha a nullhipotézis elfogadható, akkor az első sort kell továbbnézni, ha nem akkor a második sor a releváns (Welch által módosított t-próba aminem nem feltétele a szórások egyezősége). Elutasítottuk a t-próba nullhipotézisét, a két csoport várható értéke különbözőnek tekinthető (az egészségeseké alacsonyabb). Megjegyeztem, hogy ez az F-próbával kombinált t-próba kiértékelés kritizálható matematikailag.
Ezután megtanítottam a független kétmintás t-próba nemparaméteres megfelelőjét a Mann-Whitney tesztet. Ha feltehető, hogy a két csoporthoz tartozó eloszlások egymás eltoltjai, akkor azt teszteli a próba, hogy a két eloszlás ugyanaz-e. Feltétel nélkül "nagyjából" azt a nullhipotézist teszteli a teszt, hogy az egyik nagyobb, mint a másik változó valószínűsége (független generálás esetén) 1/2-e. Vagyis ez a teszt is a nagyságrendi viszonyokat teszteli (a kétmintás független t-próba a várható értékek egyezését vizsgálja, ami nagyságrendi tesztnek tekinthető). A PSPP-ben való megvalósítása sajnos csak a Command syntacs-ból lehetséges (két soros parancs, első sor: "NPAR TESTS", második sor: "
/MANN-WHITNEY=tesztelendovaltozo BY csoportositovaltozo(egyikertek,masikertek).").
Ezt követően megtanítottam az összetartozó kétmintás t próba nemparaméteres megfelelőit, a Wilcoxon és Sign-Rank teszteket (Analyze/Nonparametric tests/Two related samples). Ezeknek a teszteknek az a nullhipotézise, hogy a két változó különbségének mediánja 0, vagyis annak a valószínűsége, hogy egyik nagyobb, mint a másik épp 1/2. Így a nagyságrendi viszonyokat jól tesztelik ezek a próbák. Megjegyzem, hogy a Wilcoxon próbának feltétele, hogy a különbség változó szimmetrikus legyen. A Sign-Rank tesztnek semmilyen feltétele nincs.
Megjegyeztem, hogy a fenti nemparaméteres tesztek elsődlegesen folytonos változókra működnek, mindazonáltal az ütközések megfelelő kezelésével érvényben maradhatnak nem folytonos változóknál is. Fontos, hogy a Mann-Whitney teszt ordinális mérési szintű változón is működik.
Az elméleti bevezető után megvizsgáltuk a koleszterines kérdéseket t-próbák helyett azok nemparaméteres megfelelőikkel. A t-próbák eredményeivel azonos eredményeket kaptunk.
Megjegyeztem, hogy elterjedt, de matematikailag kritizálható lehetőség, hogy normalitásvizsgálat eredményétől függően használunk t-próbákat vagy azok nemparaméteres megfelelőit.
Az érdeklődöknek néhány további információ. Először is két kapcsolódó cikk:
Megjegyzem azt is, hogy a Mann-Whitney próba helyett kétmintás Kolmogorov-Szmirnov próbával és Wald-Wolfomitz teszttel is vizsgálhatjuk, hogy a két független csoport változója azonos eloszlást követ-e. Nekem úgy tűnik, hogy a Mann-Whitney teszttel nagyságrendi viszonyokat jobban lehet vizsgálni (ezt a kijelentést lehet kritizálni).
Fontos az is, hogy a t-próba (párosított és a független t-próba Welch verzióját gondoltam végig) ha nagy a mintaelemszám, akkor határeloszlás tételeknek köszönhetően akkor is alkalmazható ha normalitás nem teljesül abban az esetben ha a vizsgált változók szórásai végesek (illetve a független t-próba esetén szükséges feltevés, hogy a két csoport létszámának aránya konstanshoz tartson). Továbbá bizonyos esetekben akkor is lehet használni nem normális eloszlásokra ha nem olyan nagy a mintaelemszám (robosztus próba). Természetesen az is igaz, hogy rangstatisztikán alapuló Mann-Whitney, Wilcoxon és sign-rank próbákat lehet használni normális eloszlás esetén is. Meglehetősen nagy a szakirodalma a két lehetőség összehasonlításának.