Kói Tamás honlapja

Excel segédanyag 1

Excel segédanyag 2

Alul olvashatjátok az első leckét. Az SPSS súgója, a főoldalon belinkelt Brief Guide és az óravázlat sokat segít. Bármi kérdésetek van írjatok emailt (koitomi@math.bme.hu)! A beadási határidő gyakorlat előtti nap 20 óra.

Első házi

Fontos!!! A leckét a samatiok@gmail.com -ra küldjétek (math-os tárhely sajnos véges)!!!

Az adminisztratív tudnivalók után importáltunk két felvételi eredményeket tartalmazó excel fájlt (lásd fent). Megbeszéltük, hogy két ablakon lehet nézni az adathalmazt. Röviden áttekintettük a Variable view lehetőségeit: változók mérési szintjei (nominális, ordinális, skála), címkézés stb. Data/Merge opcióval egyesítettük a két excel fájlt. Véletlent generáltunk a Transform/Compute Variable segítségével. Eszerint sorba rendeztünk. Majd kereszttáblákat készítettünk az Analyze/Descriptive statistics/Crosstabs segítségével, ahol is a Simpson paradoxonnal találkoztunk. Megtanultuk, hogy az outputablakot külön kell menteni.
Az óra végefelé elmagyaráztam a diszkrét illeszkedésvizsgálatra használt chi-négyzet tesztet. Volt szó elsőfajú és másodfajú hibáról. Általánosabb nézőpontból a teszt működése a következő. A független minták függvényeként kiszámolunk egy S statisztikát (S csak egy jelölés). Ez egy valószínűségi változó. A nullhipotézis teljesülése esetén ennek ismerjük az eloszlását (legalább aszimptotikusan). Ezt az eloszlást felhasználva felveszünk egy olyan intervallumot, hogy annak a valószínűsége, hogy S odaesik 95% legyen (ha 95%-os szignifikancia szinten dolgozunk). Ezzel az elsőfajú hibát 5%-ra állítottuk be. Az intervallumot úgy vesszük fel, hogy a legjobb legyen a másodfajú hiba szempontjából, de azt pontosan kontrollálni nem tudjuk. Ez utóbbi megjegyzés a konkrét chi-négyzet tesztnél azt jelenti, hogy a felvett intervallum bal végpontja a 0. Ekkor a tesztünk a következő: ha S beleesik az intervallumba akkor elfogadjuk a nullhipotézist, ha nem esik bele elutasítjuk. Fontos, hogy az SPSS kicsit megcsavarva működik. Vegyük észre, hogy ha 99%-os szinten dolgozunk, akkor az elfogadási intervallum nő. Az SPSS azt csinálja, hogy egy konkrét statisztikára megkeresi azt a szignifikancia szintet, amelyen épp határon van a nullhipotézis elfogadása és elutasítása, és 1-ből kivonja ezt a szignifikanciaszintet, ezt én p értéknek nevezem, az SPSS sig. jelzés alá írja ki. Így ha 95%-os szinten dolgozunk, akkor ha az SPSS 0,05 alatti p-értéket ír ki, akkor elutasítjuk a nullhipotézist, ha nagyobbat akkor elfogadjuk. A fentiek alapján (és az órai bővebb magyarázat alapján) így ha egy statisztikai tesztről megmondom, hogy milyen feltételek mellett lehet használni, mi a nullhipotézis és mi az ellenhipotézis, akkor az elég információ ahhoz, hogy az SPSS-ben ezt a tesztet lefuttassátok és kiértékeljétek.