Koleszterin

Skewness and kurtosis

Órai anyag (két munkalapon is dolgoztunk)

Órai jegyzet


Elméleti paraméterekről és az azokat közelítő statisztikákról volt szó. Többek között megértettük, hogy a korrigált empirikus szórásnégyzet miért torzítatlan becslése a szórásnégyzetnek. Megtanítottam a standard error of mean-t, ami a mintaátlag statisztika elméleti szórásának mintából való közelítését adja ((korrigált empirikus szórás)/gyök(n)). A fenti honlapot is felhasználva megértettük az elméleti ferdeséget (skewness) és csúcsosságot (kurtosis), az ezeket közelítő statisztikákat és azok standrad error-jait (a statisztikák szórásának mintából való közelítései). Ezután a fenti koleszterines file-ban ki is számoltuk ezeket a statisztikákat. Ezután feltettük azt a kérdés, hogy vajon a háttérváltozó várható értéke 260-e. Tekintve, hogy a második napi koleszterin mintaátlaga 253 körüli és a standard error of mean pedig 9 körüli megállapítottuk, hogy nincs okunk elvetni azt a hipotézist, hogy a szívroham után 2 nappal az átlagos koleszterin 260 (ekkora eltérés magyarázható a véletlennel, lásd szigma szabályok a második munkalapon). Hamarosan a hipotézisvizsgálat fogalomrendszerével matematikailag precízebben fogunk vizsgálni ilyen és ehhez hasonló kérdéseket.

Ezután kvartiliseket számoltunk, doboz diagramm (boxplot) illetve pontfelhő (scatter plot) ábrákat készítettünk. Végül belekezdtünk a konfidencia intervallum a normális eloszlás várható érétkére ismert szórás esetén témakörbe.