Kói Tamás honlapja

U vagy Z próba

Táblakép 1

Táblakép 2

Táblakép 3

Először átbeszéltük a fenti első két táblaképeken található elméleti tudnivalókat. Általánosabb nézőpontból az U (vagy másnéven Z) teszt működése a következő. A független minták függvényeként kiszámolunk egy U statisztikát. Ez egy valószínűségi változó hiszen a minta függvénye. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (standard normális). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy U odaesik 1-Epszilon legyen (Epszilon az elsőfajú hiba). Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét esetben (kétoldali a próba) azt jelenti, hogy a felvett intervallum origó körüli szimmetrikus. Ekkor a tesztünk a következő: ha U beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Két fontos tulajdonságra hívtam fel a figyelmeteket. Rögzített mintaszámnál ha csökkentjük az elsőfajú hibát, akkor nő a másodfajú és viszont. A másik fontos dolog, hogy rögzített elsőfajú hiba mellett, tetszőleges ellenhipotézisbeli eloszlás esetén a másodfajú hiba 0-hoz tart ha a mintaelemszám végtelenhez tart (konzisztens a teszt). Ezután definiáltam a p-értéket. A p-érték az az elsőfajú hibaszint amikor épp határon lenne az elfogadás és az elutasítás. Sok program eleve ezt számolja. Megbeszéltük, hogy az U próba esetén, hogy lehet kiszámolni illetve azt, hogy p-értékre alapozva, hogy lehet kiértékelni a tesztet.

Ezután 10 elemű szimulált mintán elvégeztük az U-próbát (m_0 = 185 volt a nullhipotézisünk). A múltkori konfidenciás excel file-t módosítottuk, mert így láthatóvá vált az a triviális tény, hogy a nullhipotézist pontosan akkor fogadjuk el, ha a 185 benne van a megfelelő szimmetrikus konfidenciaintervallumban. Ezután a 10 elemű minta 1000-szeri felvételével közelítettük a másodfajú hibát abban az esetben amikor az igazi várható érték m=180.

Ezután analitikusan is felírtuk a másodfajú hibát, majd a fenti Excel file második munkalapján ábrázoltuk az m függvényében.

Az U-próbáról (és általában a hipotézisvizsgálatról) bővebb információt találtok a Bolla-Krámli statisztika könyv 133-138 oldalain.