Órai munka (első munkalapon kvartilisek a második munkalpon empririkus eloszlásfüggvény)


Órai munka (konfidencia intervallum)



ELőször kvartiliseket számoltunk (lásd fenti file). Ezután megértettük a változók mérési szintjeit (nominális, ordinális, intervallum illetve skála) majd ehhez kötődően azt, hogy mediánt már ordinálisra is számolhatunk míg átlagot csak intervallum szinttől kezdve érdemes számolni.

Ezután elkészítettük a koleszterines file első változójának empirikus eloszlásfüggvényét (lásd Bolla-Krámli statisztika könyv 67. oldal). Techinikailag az adatsort mégegyszer a meglévő alá másoltuk majd a Kicsi() függénnyel rendeztük. Ezután az ábrázolandó pontok második koordinátáját értelemszerűen kitöltöttük. Majd szakaszokkal összekötött pontfelhő ábrát kértünk. Végül az (átlag, empirikus szórás) paraméterű normális eloszlás eloszlásfüggvényével kiegészítettük az ábrát. A látottak is alátámasztják a minta normaliátást.

Ezután megtanultunk konfidencia intervallumot szerkeszteni a normális eloszlás várható értékére ismert szórás esetén (lásd Bolla-Krámli statisztika könyv 127-128. oldalai). A második Excel file-ban 10 elemű szimulált mintán fel is vettük a konfidenciaintervallumot (a szimuláció sokszor segíti a megértést). Fontos megérteni, hogy itt egy véletlen intervallumról van szó, ami 1-Epsilon valószínűséggel tartalmazza a háttérváltozó várható értékét. A megértést segíti ha ezt a kijelentést relatív gyakorisággal mondjuk el. Ha sokszor veszünk fel 10 elemű mintát, akkor a mintafelvételek kb (1-Epszilon)-ad részében fogja tartalmazni a kapott determinisztikus intervallum a háttérváltozó várható értékét. Ezt a kijelentést vizualizáltuk pontfelhő ábra segítségével nem túl sok (15) mintafelvétellel.