Koleszterin


Alul olvashatjátok a második leckét. Bármi kérdésetek van írjatok emailt! A beadási határidő a következő gyakorlat előtti nap 20 óra.

Házi (már olvasható)


Fontos!!! A leckét a samatiok@gmail.com -ra küldjétek (math-os tárhely sajnos véges)!!!



Órai anyagot tartalmazó script (Student-t sűrűségfüggvénye)


Órai anyagot tartalmazó script (koleszterines adatsor átalakítása)


A fenti koleszterines file-al dolgoztunk. Három kérdést tettünk fel ehhez az adatfile-hoz kötődően. Egy általunk gondolt konkrét értéknek (órán 170-t mondtam) tekinthető-e a szívrohamon átesettek koleszterin szintjének várható értéke a szívroham után 2 nappal? Különbözik a szívrohamon átesettek 2. és 14. napi koleszterintje? Különbözik a szívrohamon átesettek 14. napi és az egészségesek koleszterinszintje?

Az első kérdést egymintás kétoldali t-próbával, a másodikat összetartozó kétmintás kétoldali t-próbával míg a harmadikat független kétmintás kétoldali t-próbával tudjuk megválaszolni első körben (feltettük az adatok normalitását, egyoldali próbával az egyszerűség végett nem foglalkoztunk). Röviden elmagyaráztam ezeket a próbákat. Fontos, hogy az összetartozó kétmintás t-próba egyszerűen a különbségváltozóra futtatott, annak 0 várható értékűségét tesztelő egymintás kétoldali t-próba.

Ezután függvényt írtunk, amely ábrázolta és kimentette a munkakönyvtárba az 1-10 szabadsági fokú Student t-eloszlások sűrűséggfüggvényét (mindegyik ábrára ráraktuk a standard normális sűrűségfüggvényét is). A részletek megtalálhatóak a fent belinkelt órán készült R script-ben.

Ezt követően a belinkelt (fent már említett) koleszterin szintes adatfile-al foglalkoztunk. Két letölthető verzió is van, az elsőt töltöttük le, és a második formátumára alakítottuk (így a kontroll csoport eredményeit is meg tudtuk tartani). Majd a fent említett harmadik kérdésre független kétmintás t-próbával kerestük a választ. 95%-os szignifikanciával dolgozva elutasítottuk a várható értékek azonosságát állító nullhipotézist. Az átlagokat is megvizsgálva kijelentettünk (mean() függvénnyel külön megnéztük az átlagokat), hogy a betegek koleszterin értéke a 2. napon szignifikánsan nagyobb az egészségesek koleszterinjénél. Az átalakítások és a futtatás technikai részletei megtalálhatóak a fent belinkelt script-ben. Fontos, hogy az R-ben a default beállítás szerint a t-próba Welch által módosított verziója fut le, amelynek nem feltétele a szórások egyezősége. Elég sok egyéb programban a független kétmintás t-próbánál automatikusan előbb egy F-próba fut le, amelynek nullhipozézise a szórások egyezősége. Ezután a szórások egyezőségének elfogadásától függően kell kiértékelni a klasszikus illetve a Welch által módosított t-próbát. Ennek a hozzáállásnak a hátránya az, hogy itt összességében egy összetett hipotézisvizsgálatról van szó, ami torzítja a próbákra vonatkozó klasszikus eredményeket (például a Welch próba csak az olyan realizációkon hajtódik végre, amelyek empirikus szórása eléggé különbözik). Emiatt én pozitív dolognak tartom, hogy az R-ben az alapbeállítással automatikusan a Welch-féle t-próba hajtódik végre.

Az összefoglaló elején feltett első két kérdésre órán nem válaszoltunk. A háziban nektek kell majd a feltett kérdések kis módosulataira válaszolnotok. Megjegyzem, hogy a független kétmintás t-próbát órán rosszul futtattuk. Az órai anyagot tartalmazó script-ben megtaláljátok a javítást.