Empirikus eloszlásfüggvény


Órán készített Excel file II (4 munkalapon is dolgoztunk)


Órai jegyzet


Ezután elkészítettük a koleszterines file első változójának empirikus eloszlásfüggvényét (lásd Bolla-Krámli statisztika könyv 67. oldal). Techinikailag az adatsort mégegyszer a meglévő alá másoltuk majd a Kicsi() függénnyel rendeztük. Ezután az ábrázolandó pontok második koordinátáját értelemszerűen kitöltöttük. Majd szakaszokkal összekötött pontfelhő ábrát kértünk. Végül az (átlag, empirikus szórás) paraméterű normális eloszlás eloszlásfüggvényével kiegészítettük az ábrát. A látottak is alátámasztják a minta normaliátást.

Megtanultunk konfidencia intervallumot szerkeszteni a normális eloszlás várható értékére ismert szórás esetén. A negyedik munkalapon 10 elemű szimulált mintán fel is vettük a konfidenciaintervallumot (a szimuláció sokszor segíti a megértést). Fontos megérteni, hogy itt egy véletlen intervallumról van szó, ami 1-Epsilon valószínűséggel tartalmazza a háttérváltozó várható értékét. A megértést segíti ha ezt a kijelentést relatív gyakorisággal mondjuk el. Ha sokszor veszünk fel 10 elemű mintát, akkor a mintafelvételek kb (1-Epszilon)-ad részében fogja tartalmazni a kapott determinisztikus intervallum a háttérváltozó várható értékét. Ezt a kijelentést vizualizáltuk pontfelhő ábra segítségével

Eztuán átbeszéltük az U (vagy másnéven Z) tesztet. Általánosabb nézőpontból a teszt működése a következő. A független minták függvényeként kiszámolunk egy U statisztikát. Ez egy valószínűségi változó hiszen a minta függvénye. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (standard normális). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy U odaesik 1-Epszilon legyen (Epszilon az elsőfajú hiba). Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét esetben (kétoldali a próba) azt jelenti, hogy a felvett intervallum origó körüli szimmetrikus. Ekkor a tesztünk a következő: ha U beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Két fontos tulajdonságra hívtam fel a figyelmeteket. Rögzített mintaszámnál ha csökkentjük az elsőfajú hibát, akkor nő a másodfajú és viszont. A másik fontos dolog, hogy rögzített elsőfajú hiba mellett, tetszőleges ellenhipotézisbeli eloszlás esetén a másodfajú hiba 0-hoz tart ha a mintaelemszám végtelenhez tart (konzisztens a teszt). Ezután felírtuk a másodfajú hiba képletét.

Először megoldottuk a második munkalapon található feladatot. Majd a másodfajú hibát ábrázoltuk az m, vagyis az igazi várható érték függvényében. Ezután az egyik értéket szimulációval is közelítettük a harmadik munkalapon.

Végül megállapítottuk azt a triviális tényt, hogy a nullhipotézist pontosan akkor fogadjuk el, ha a nullhipotézisbeli várható érték benne van a megfelelő szimmetrikus konfidenciaintervallumban.