cars.sav


idősor


health_funding.sav


Alul olvashatjátok az ötödik leckét. Az SPSS súgója, a főoldalon belinkelt Brief Guide és az óravázlat sokat segít. Bármi kérdésetek van írjatok emailt (koitomi@math.bme.hu)! A beadási határidő a zht megelőző nap dél. Ha hamarabb külditek, akkor hamarabb küldök értékelést, ami jól jöhet a zhra való készüléshez. Továbbra is a samatiok@gmail.com-ra várom a megoldásokat.

Ötödik házi


Alul olvashatjátok a negyedik házi eredményét. Ha valami nem stimmel szóljatok!

Negyedik hf eredmények


Először a cars.sav állományban közelítettük a fogyasztást a lóerővel. Az Analyze/Regression/Curve estimate-el Inverse függvényt illesztettünk. Megtettük ugyanezt az általános közelítésekre képes Analyze/Regression/Nonlinear menüponttal is. Végül a Transform/Compute és Analyze/Regression/Linear parancsokkal is. Mindhárom esetben ugyanazt kaptuk.
Ezt követően a lóerőt közelítettük lineáris regresszióval másik négy változó segítségével az Analyze/Regression/Linear menüvel. Fontos az output. Látjuk, hogy van egy Anova elemzés, aminek az a nullhipotézise, hogy a modell minden együtthatója 0. Mondtam, hogy ezt csak tájékoztató jelleggel érdemes figyelembe venni, mert normalitási feltételnek kell hozzá teljesülnie (vagy leellenőrizni ezeket a feltételeket). Fontos még az R^2-t tartalamzó táblázat, illetve az együtthatókat tartalmazó. Utóbbinál fontos a Beta oszlop, ami a sztenderdizált változókra lefuttatott regresszió együtthatóit tartalmazza (sztenderdizálni a descriptives-en belül lehet könnyedén). Ez az oszlop jobban segít összehasonlítani az együtthatókat, mert nem függ az egyes változók nagyságrendjétől. Az utolsó oszlopban láthatjuk annak a statisztikai vizsgálatnak az eredményét, ami azt vizsgálja, hogy igaz-e az, hogy a változó együtthatója 0. Ezt is csak tájékoztató jelleggel érdemes olvasni, amíg bizonyos normalitási feltételekről meg nem győződünk. Végül láttuk, hogy a Linear menüben lehet kérni automatikus módszereket, amik ki-be rakosgatják a modellbe a változókat azért, hogy találjanak egy jól közelítő modellt, amiben viszonylag kevés változó van.
Ezután előrrejelzéssel foglalkoztunk. Idősor azt jelenti, hogy az esetek időt jelképeznek. Ha idősorra kell görbét illeszteni, az azt jelenti, hogy az idő a független változó. Sok regressziós parancsnál külön fül van arra, hogy az idő legyen a független változó. Viszont ha a nemparaméteres regressziós füllel dolgoztok, akkor szükségetek lesz egy idő változóra. Data/Define dates paranccsal lehet létrehozni dátum változót. Az idosor.sav állomány első 20 megfigyelésére illesztettünk lineáris függvényt, ami által biztosított modellel előrrejeleztük a többi esetet is. Ezt a Curve estimation/save almenüjén belül tehettük meg. Ezt követően a teljes idősorra illesztettünk poligont (összeérő szakaszonként lineáris függvényt). Ezt segédváltozó segítségével tettük meg. Fontos, hogy ez is lineáris illesztés volt csak a segédváltozót is bevontuk.
Végül az employee.sav állománnyal foglalkoztunk. Először a jelenlegi fizetést becsültük lineáris regresszióval a kezdőfizetés és a jobcat segítségével. Ezt követően megjegyeztük, hogy tudva, hogy a jobcat változó nem skála változó, nem is várhatunk nagyon jó közelítést a modelltől. Nem igaz az, hogy a változó értékei közötti különbség nagyságrendek jelentenének valamit. A második modellben ezt javítottuk ki azzal, hogy a foglalkozásokra indikátorváltozókat vezettünk be. Elég két indikátor a három lehetséges értékre. Így létrehoztunk egy hivatalnoke és egy biztonsagie változót, melyek az egyén foglalkozásának megfelelően 0-1 értékűek voltak. A jobcat helyett a két indikátorváltozót szerepeltettük az új modellben, ezzel kicsit javult a közelítésünk. Úgy fogalmazhatunk, hogy megengedtük, hogy a különböző jobcat értékekre más legyen a lineáris közelítés konstansa. Ezt követően bővítettük a modellt még két változóval: a kezdőfizetés és a hivatalnoke illetve a kezdőfizetés és biztonsagie szorzatával. Ezzel megengedtük annak a lehetőségét, hogy foglalkozási kategóriánként különbözzön a lineáris becslésünk meredeksége. Úgy hívtuk ezt, hogy interakciós lehetőséggel bővítettük a modellünket. Így kaptuk a legjobb közelítést R^2 értelemben.