Kói Tamás honlapja

Órai munka

Táblakép 1 (régi, de idén is aktuális)

Táblakép 2 (régi, de idén is aktuális)

Először átbeszéltük a fenti első két táblaképeken található elméleti tudnivalókat. Általánosabb nézőpontból az U (vagy másnéven Z) teszt működése a következő. A független minták függvényeként kiszámolunk egy U statisztikát. Ez egy valószínűségi változó hiszen a minta függvénye. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (standard normális). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy U odaesik 1-Epszilon legyen (Epszilon az elsőfajú hiba). Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét esetben (kétoldali a próba) azt jelenti, hogy a felvett intervallum origó körüli szimmetrikus. Ekkor a tesztünk a következő: ha U beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Két fontos tulajdonságra hívtam fel a figyelmeteket. Rögzített mintaszámnál ha csökkentjük az elsőfajú hibát, akkor nő a másodfajú és viszont. A másik fontos dolog, hogy rögzített elsőfajú hiba mellett, tetszőleges ellenhipotézisbeli eloszlás esetén a másodfajú hiba 0-hoz tart ha a mintaelemszám végtelenhez tart (konzisztens a teszt). Ezután felírtuk a másodfajú hiba képletét.

Ezután 10 elemű szimulált mintán elvégeztük az U-próbát (m_0 = 180 volt a nullhipotézisünk). A múltkori konfidenciás excel file-t módosítottuk, mert így láthatóvá vált az a triviális tény, hogy a nullhipotézist pontosan akkor fogadjuk el, ha a 180 benne van a megfelelő szimmetrikus konfidenciaintervallumban. Ezután a 10 elemű minta 1000-szeri felvételével közelítettük először a beállított elsőfajú hibát majd a másodfajú hibát abban az esetben amikor az igazi várható érték m=175.

A második munkalapon az első munkalapon található teszt másodfajú hibáját ábrázoltuk az m, vagyis az igazi várható érték függvényében.

Ezután adott (változtatható) szabadságfokú Student-féle t-eloszlás sűrűségfüggvényét ábrázoltuk a standard normális eloszlás sűrűségfüggvényével közös ábrán.

Végül elmondtam, hogy ha a szórás nem ismert akkor minden analóg módon megy csak az ismert szórást a korrigált empirikus szórásra kell cserélni illetve a normális eloszlás helyett az n-1 szabadsági fokú Student-féle t eloszlás kvantiliseit kell használni (n a minta elemszáma). Ezt a módosítást egymintás, kétoldali t-próbának nevezik. Ezt használva a harmadik munkalapon teszteltük azt a nullhipotézist, hogy szívroham után 2 nappal a koleszterin várható értéke 260.

Az U és T próbákról (és általában a hipotézisvizsgálatról) bővebb információt találtok a Bolla-Krámli statisztika könyv 133-138 illetve a 156-163 oldalain.