elsohazivaz2017.R


Alul olvashatjátok az első leckét. Bármi kérdésetek van írjatok emailt! A beadási határidő a következő gyakorlat előtti nap 20 óra.


Házi


Fontos!!! A leckét a samatiok@gmail.com -ra küldjétek (math-os tárhely sajnos véges)!!!




Khi-négyzet próba script

Koleszterin


Koleszterin file átalakítása


Az óra elején újra lefuttattuk a múlt órai kockadobást szimuláló parancsokat. Majd feltettük újra azt a kérdést, hogy vajon mennyi egyenletlenséget írhatunk a véletlen rovására, mikortól kell gyanakodnunk arra, hogy esetleg a kokcadobás szimuláló algoritmusunk nem működik tökéletesen. Ezt követően bevezettelek titeket a hipotézisvizsgálatba, amellyel matematikai választ adhatunk a feltett kérdésre. Kicsit konkrétabban, elmagyaráztam a diszkrét illeszkedésvizsgálatra használt chi-négyzet tesztet. Volt szó elsőfajú és másodfajú hibáról. Általánosabb nézőpontból a teszt működése a következő. A független minták függvényeként kiszámolunk egy S statisztikát (S csak egy jelölés). Ez egy valószínűségi változó. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (legalább aszimptotikusan). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy S odaesik 95% legyen (ha 95%-os szignifikancia szinten dolgozva). Ezzel az elsőfajú hibát 5%-ra állítottuk be. Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét chi-négyzet tesztnél azt jelenti, hogy a felvett intervallum bal végpontja a 0. Ekkor a tesztünk a következő: ha S beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Két fontos tulajdonságra hívtam fel a figyelmeteket. Rögzített mintaszámnál ha csökkentjük az elsőfajú hibát, akkor nő a másodfajú és viszont. A másik fontos dolog, hogy rögzített elsőfajú hiba mellett, tetszőleges ellenhipotézisbeli eloszlás esetén a másodfajú hiba 0-hoz tart ha a mintaelemszám végtelenhez tart (konzisztens a teszt). Ezt követően rátértem arra, hogy hogyan kell kiértékelni R-ben. Az R azt csinálja, hogy egy konkrét statisztikára megkeresi azt az elsőfajú hibát, amelyen épp határon van a nullhipotézis elfogadása és elutasítása, ezt hívjuk p értéknek.

!!!Így ha 5%-os elsőfajú hibával dolgozunk (95%-os szignifikanciával), akkor 0,05 alatti p-érték esetén utasítjuk el a nullhipotézist. !!!

A fentiek alapján (és az órai bővebb magyarázat alapján) ha egy statisztikai tesztről megmondom, hogy milyen feltételek mellett lehet használni, mi a nullhipotézis és mi az ellenhipotézis, akkor az elég információ ahhoz, hogy ezt a tesztet lefuttassátok és kiértékeljétek.

Ezt követően a kockadobás szimulációra a chi-négyzet teszttel (chisq.test(table(kocka)) igazoltuk, hogy a gyakoriság táblázatban látott kis egyenletlenséget okozhatja a véletlen, vagyis nincs okunk abban kételkedni, hogy jó a szimulátorunk (tényleg egyforma az egyes értékek valószínűsége). Technikailag a függvény egy listával tér vissza, aminek harmadik koordinátája a p-érték. Megjegyeztem azt is, hogy a függvény argumentumába meg lehet adni, hogy milyen eloszláshoz való illeszkedést teszteljen a program (ahogy láttuk az egyenletes a default).

Ezután a fenti koleszterines file-al dolgoztunk. Három kérdést tettünk fel ehhez az adatfile-hoz kötődően. Egy általunk gondolt konkrét értéknek (órán 240-t mondtam) tekinthető-e a szívrohamon átesettek koleszterin szintjének várható értéke a szívroham után 2 nappal? Különbözik a szívrohamon átesettek 2. és 14. napi koleszterintje? Különbözik a szívrohamon átesettek 14. napi és az egészségesek koleszterinszintje?

Ezt követően a belinkelt (fent már említett) koleszterin szintes adatfile-lal ténylegesen elkezdtünk dolgozni. Két letölthető verzió is van, az elsőt töltöttük le, és a második formátumára alakítottuk (így a kontroll csoport eredményeit is meg tudtuk tartani). Fontos, hogy az így kialakított adatfile-ban a sorok függetlenek egymástól (minden sor külön pácienshez kötődik). Jövő héten a matematikai statisztika eszközeivel válaszolni fogunk a feltett kérdésekre.