Koleszterin

Skewness and kurtosis

Órai anyag (három munkalapon is dolgoztunk)


Először az előadáson tanult heurisztikus normalitásvizsgálatottal megállapítottuk, hogy a második napi koleszterin változó normális eloszlásúnak tekinthető (órai munka második munkalapja).
Ezután elméleti paraméterekről és az azokat közelítő statisztikákról volt szó. Többek között megértettük, hogy a korrigált empirikus szórásnégyzet miért torzítatlan becslése a szórásnégyzetnek. Megtanítottam a standard error of mean-t, ami a mintaátlag statisztika elméleti szórásának mintából való közelítését adja ((korrigált empirikus szórás)/gyök(n)). A fenti honlapot is felhasználva megértettük az elméleti ferdeséget (skewness) és csúcsosságot (kurtosis), az ezeket közelítő statisztikákat és azok standrad error-jait (a statisztikák szórásának mintából való közelítései). Ezután a fenti koleszterines file-ban ki is számoltuk ezeket a statisztikákat. Az empirikus korrelációt beépített függvénnyel és "kézzel" is kiszámoltuk, így meggyőződtünk arról, hogy a beépített Excel függvény a korrekciós képletet használja az empirikus kovariancia meghatározásához. Ezután feltettük azt a kérdés, hogy vajon a háttérváltozó várható értéke 260-e. Tekintve, hogy a második napi koleszterin mintaátlaga 253 körüli és a standard error of mean pedig 9 körüli megállapítottuk, hogy nincs okunk elvetni azt a hipotézist, hogy a szívroham után 2 nappal az átlagos koleszterin 260 (ekkora eltérés magyarázható a véletlennel, lásd szigma szabályok a harmadik munkalapon). Hamarosan a hipotézisvizsgálat fogalomrendszerével matematikailag precízebben fogunk vizsgálni ilyen és ehhez hasonló kérdéseket.