R bevezető script


Simpson paradoxon script

Excel segédanyag csv-ben


egymintás teszt a Bernoulli paraméterére


Táblakép 1


Táblakép 2


Az óra elején megtanítottam az egymintás U-próba egyoldali verzióit. Megbeszéltük, hogy ha a statisztika iránya összhangban van az ellenhipotézisbeli iránnyal, akkor a kétoldali p-értékét 2-vel elosztva kapjuk az egyoldali p-értéket. Ehhez kötődően fontos, hogy amikor kétoldali próbát végzünk azt úgy lehet felfogni, hogy egyszerre teszteljük mindkét irányú eltérést. Igazából mindkét iránnyal szemben szigorúbbak vagyunk, mint ha egyoldali próbát végeztünk volna. Így a kétoldali próba kiértékelésébe vihetünk irányultságot (pl kétoldali próbát végezve 0.05 elsőfajú hiba mellett azt találtuk, hogy a diéta szignifikánsan javítja a teljesítményt). Megjegyeztem, hogy az egyoldali és kétoldali próbák viszonyában az a legfontosabb, hogy mindig tegyük egyértelművé, hogy melyiket végeztük el.

Megjegyeztem azt is, hogy ha az ellenhipotézist fogadjuk el, akkor a p-érték mutatja, hogy mennyire: minél kisebb annál inkább az ellenhipotézis mellett vagyunk.

Ezután bevezettelek titeket az R-be. Nagyjából végigmentünk a fenti bevezető R-scripten illetve a jól ismert Simpson paradoxonos mesterséges adatsort beolvastuk és kereszttáblát készítettünk (Simpson paradoxon script). Fontos, hogy a függvények dokumentációit a neten is megtaláljátok (ha package-beli a függvény, akkor a package dokumentáló pdf-jét kell keresni).

Végül átismételtük az egymintás teszteket a Bernoulli minta paraméterére (lásd táblaképek) majd saját függvényt írva megoldottuk a feladattár 42-es és 43-as feladatait. Annyit szeretnék csak kiemelni, hogy az egzakt kétoldali teszt esetén a p-értéket csak a p_0 = 0.5 esetben definiáltam (a 42-es feladathoz ez kellett). Itt találtok 3 lehetőséget is az általános definícióra.