]>
Ebben az alfejezetben számos fontos hipotézis próbát fogunk tanulmányozni, melyeket általánosan khi-négyzet próbáknak hívunk. Ahogy kitalálható, ez az elnevezés arra utal, hogy ezekre az esetekre a próbafüggvény (határértékben) khi-négyzet eloszlású. Bár több különböző próba esik ebbe az általános kategóriába, mindegyikükben közösek a következők:
Tegyük fel, hogy egy véletlen minta a Bernoulli eloszlásból ismeretlen sikerparaméterrel. Így ezek független valószínűségi változók, amik az 1 illetve a 0 értéket veszik fel illetve valószínűséggel. A versus hipotézist akarjuk tesztelni, ahol adott. Természetesen már tanulmányoztunk ilyen próbákat a Hipotézisvizsgálat a Bernoulli modellben alfejezetben. De tartsuk észben, hogy ezek a módszerek elvezetnek olyan új modellekhez, amiket még nem tanulmányoztunk.
Legyen és . Ezek a statisztikák megadják az 1-ek illetve 0-k előfordulásainak számát (a gyakoriságot). Továbbá tudjuk, hogy mindkettő binomiális eloszlású; paraméterei és , míg paraméterei és . Speciálisan, , , és . Továbbá idézzük fel, hogy elégséges -re. Így minden jó próbafüggvénynek függvényének kell lenni. Továbbá emlékezzünk arra, hogy ha nagy, akkor eloszlása közelítően normális a centrális határeloszlás tétel szerint. Legyen Jegyezzük meg, hogy standardizáltja mellett. Így, ha nagy, közelítően standard normális eloszlású mellett, és emiatt közelítően khi-négyzet eloszlású 1 szabadságfokkal mellett. Szokás szerint jelölje a szabadságfokú khi-négyzet eloszlás kvantilis függvényét.
Mutassuk meg, hogy versus közelítő próbája szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha .
Mutassuk meg, hogy az 1. feladatban szereplő próba ekvivalens a próbafüggvényű torzítatlan próbával (a közelítő normális próba), amit a Hipotézisvizsgálat a Bernoulli modellben alfejezetben határoztunk meg!
A következő feladat kritikus eredménye speciális reprezentációja az általánosítás érdekében. Legyen és legyen . Jegyezzük meg, hogy ezek a 0-k illetve az 1-ek elvárt gyakoriságai mellett.
Mutassuk meg, hogy
Ez a reprezentáció azt mutatja, hogy a próbafüggvényünk a melletti elvárt gyakoriságok és a megfigyelt gyakoriságok közti eltérést méri. Természetesen nagy értéke bizonyíték mellett. Végül jegyezzük meg, hogy bár két tag szerepel kifejtésében a 3. feladatban, de csak egy a szabadságfok, mivel . A megfigyelt és az elvárt gyakoriságok egy -es táblázatban tárolhatók.
Tegyük fel, hogy van néhány mintánk néhány (esetleg) különböző, független Bernoulli kísérlet folyamatból. Speciálisan tegyük fel, hogy egy elemű véletlen minta a Bernoulli eloszlásból ismeretlen sikerparaméterrel minden esetén. Továbbá az minták függetlenek. Az ismeretlen paramétervektorra vonatkozó hipotézist akarjuk tesztelni. Két gyakori eset van, amit megvizsgálunk, de először bevezetünk egy lényeges jelölést, amire mindkét esetnél szükségünk lesz. és esetén jelölje azt, hogy hányszor fordult elő az mintában. A megfigyelt gyakoriság binomiális eloszlású; és paraméterekkel, míg és paraméterekkel.
Tekintsünk egy adott paramétervektort. A következő hipotézist kívánjuk tesztelni: , versus . Mivel a nullhipotézis meghatározza értékeit minden esetén, ezt teljesen meghatározott esetnek hívjuk. Most legyen és . Ezek az értékek a 0-k illetve az 1-ek várt gyakoriságai a mintából mellett.
Felhasználva a 3. feladatot és a függetlenséget, mutassuk meg, hogy ha nagy minden esetén, akkor eloszlása közelítően khi-négyzet eloszlás szabadságfokkal!
Hozzávetőlegesen a nagy
azt jelenti, hogy
minden
és
esetén. De természetesen minél nagyobbak ezek az elvárt gyakoriságok, annál jobb.
Nagy minta feltételezése mellett mutassuk meg, hogy egy közelítő próba versus -re szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
Még egyszer megjegyezzük, hogy a próbafüggvény az elvárt és a megfigyelt gyakoriságok közti eltérést méri minden kimenet és minden minta esetén. tag szerepel kifejtésében a 4. feladatban, de csak a szabadságfok, mivel minden esetén. A megfigyelt és az elvárt gyakoriságok egy -es táblázatban tárolhatók.
Tegyük fel, hogy a nullhipotézist akarjuk tesztelni, azaz az összes siker-valószínűség megegyezik, a alternatív hipotézissel szemben, mely szerint nem minden valószínűség ugyanaz. Jegyezzük meg, hogy szemben az előző modellel, a nullhipotézis nem határozza meg a közös sikerparamétert, -t. De jegyezzük meg, hogy a nullhipotézis mellett az minta összevonható egy Bernoulli kísérletekből származó nagy mintává sikerparaméterrel. Így a természetes megközelítés: először -t becsülni, aztán meghatározni a próbafüggvényt, ami méri az eltérést az elvárt és a megfigyelt gyakoriságok közt, ahogy eddig. A kihívás a próbafüggvény eloszlásának megtalálása.
Jelölje a mintanagyságot, amikor a mintákat összevontuk. Ekkor az összesített mintaátlag, ami ebben az esetben a sikerek összesített részaránya: A minta-gyakoriság legjobb becslése, a szó minden értelmében. Továbbá legyen és . Ezek a 0-k illetve 1-ek becsült elvárt gyakoriságai az mintából mellett. Természetesen ezek a becsült gyakoriságok most statisztikák (és így véletlenek), nem paraméterek. Az előzőeknek megfelelően definiáljuk a próbafüggvényt: Kiderült, hogy mellett eloszlása khi-négyzet eloszláshoz tart szabadságfokkal, ahogy .
Mutassuk meg, hogy egy közelítő próba versus -re szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
Intuitívan, elvesztettünk egy szabadságfokot a teljesen meghatározott esethez képest, mivel becsülnünk kell az ismeretlen sikerparamétert. A megfigyelt és az elvárt gyakoriságok ismét egy -es táblázatban tárolhatók.
A következő modellünk az egymintás Bernoulli modellt általánosítja egy másik irányba. Tegyük fel, hogy polinomiális kísérletek sorozata. Így ezek független, azonos eloszlású valószínűségi változók, mindegyik egy elemű halmazbeli értéket vehet fel. Ha akarjuk, feltételezhetjük, hogy ; az egymintás Bernoulli modell -nek felel meg. Jelölje a mintaváltozók közös sűrűségfüggvényét -en, így és esetén. értékeit ismeretlennek tételezzük fel, de természetesen , tehát valójában ismeretlen paraméterünk van. Egy -en adott sűrűségfüggvény esetén a versus hipotézist akarjuk tesztelni.
Mostanra világosnak kell lenni az általános megközelítésünknek. -vel jelöljük, hogy hányszor fordul elő az mintában. Jegyezzük meg, hogy binomiális eloszlású és paraméterekkel. Így a előfordulásainak várható száma mellett. A próbafüggvényünk természetesen Kiderült, hogy mellett eloszlása khi-négyzet eloszláshoz tart szabadságfokkal, ahogy . Jegyezzük meg, hogy tag szerepel kifejtésében, de csak a szabadságfok, mivel .
Mutassuk meg, hogy egy közelítő próba versus -re szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
Általában az szükséges, hogy minden esetén, de a nagyobb elvárt gyakoriságok jobbak.
Ahogy kitalálható volt, az utolsó általánosítás a többmintás polinomiális modell. Speciáliasan tegyük fel, hogy egy elemű véletlen minta egy halmazon, ami elemű, minden -re. Továbbá feltesszük, hogy az minták függetlenek. Az általánosság megszorítása nélkül legyen . Ekkor a többmintás Bernoulli modellre redukálódik, és megfelel az egymintás polinomiális modellnek.
Jelölje a változók közös sűrűségfüggvényét az mintában, azaz , és esetén. Ezek általában ismeretlenek, így a paramétervektorunk a sűrűségfüggvények vektora: . Természetesen esetén, tehát ténylegesen ismeretlen paraméterünk van. Az -re vonatkozó hipotézis tesztelése érdekel minket. Ahogy a többmintás Bernoulli modellben, két alapeset van, amit megvizsgálunk, de előbb bevezetjük az alapvető jelölést, amire mindkét esetben szükségünk lesz: és esetén jelölje a kimenetek számát az mintában. A megfigyelt gyakoriság, binomiális eloszlású és paraméterekkel.
Tekintsünk egy adott sűrűségfüggvény vektort -en, jelölje . A versus hipotézist akarjuk tesztelni. Mivel a nullhipotézis meghatározza értékeit minden -re és -re, ezt az esetet teljesen meghatározott esetnek hívjuk. Legyen . Ez a várt gyakorisága a kimeneteknek az mintában mellett.
Használjuk az egymintás polinomiális eset eredményét és a függetlenséget, hogy megmutassuk, ha nagy minden -re, akkor közelítően khi-négyzet eloszlású szabadságfokkal!
Szokás szerint az a jó
, ha
minden
-re
és
-re. Természetesen minél nagyobbak ezek a várt gyakoriságok, annál jobb.
Nagy minta feltételezése mellett mutassuk meg, hogy egy közelítő próba versus -re szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
Ahogy mindig, a próbafüggvény az elvárt és a megfigyelt gyakoriságok közti eltérést méri minden kimenet és minden minta esetén. tag van kifejtésében a 8. feladat szerint, de szabadságfokot elvesztünk, mivel minden -re.
Tegyük fel, hogy a nullhipotézist akarjuk tesztelni, azaz az összes sűrűségfüggvény megegyezik, a alternatív hipotézissel szemben, hogy nem minden sűrűségfüggvény ugyanaz. Jegyezzük meg, hogy szemben az előző modellel, a nullhipotézis nem határozza meg a közös sűrűségfüggvényt, -et. De jegyezzük meg, hogy a nullhipotézis mellett az minta összevonható egy nagy mintává, ami polinomiális kísérletekből származik sűrűségfüggvénnyel. Így a természetes megközelítés: először értékeit becsülni, aztán definiálni a próbafüggvényt, ami az eltérést méri a várt és a megfigyelt gyakoriságok közt, ahogy eddig.
Jelölje az összevont minták mintanagyságát. A mellett legjobb becslése Így az minta esetén a kimenet várt gyakoriságának becslése mellett . Ez a becsült gyakoriság ismét statisztika (és így véletlen), és nem paraméter. Akárcsak előbb, a próbafüggvény Ahogy mostanra már nem lehet kétségünk, mellett eloszlása khi-négyzet eloszláshoz konvergál, ahogy . De nézzük, meg tudjuk-e határozni a szabadságfokot heurisztikusan.
Bizonyítsuk be, hogy határeloszlása szabadságfokú!
Mutassuk meg, hogy versus közelítő próbája szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
Az illeszkedésvizsgálat annak eldöntésére szolgál, hogy egy ismeretlen mintavételezett eloszlás megegyezik-e egy speciális, meghatározott eloszlással, vagy egy paraméteres eloszláscsaládhoz tartozik-e. Az ilyen próbák nyilvánvalóan alapvetőek és fontosak. Az egymintás polinomiális modell egy elég általános illeszkedésvizsgálati próbához vezet.
Kiindulásként tegyük fel, hogy van egy megfigyelhető valószínűségi változónk egy kísérletből, ami egy általános halmazbeli értékeket vesz fel. Az valószínűségi változó lehet folytonos vagy diszkrét eloszlású és lehet egy- vagy többváltozós. Azt a nullhipotézist akarjuk tesztelni, hogy eloszlása egy adott, teljesen meghatározott eloszlás, vagy hogy eloszlása egy adott paraméteres családhoz tartozik.
Mindkét esetben első lépésként mintavételezzük -et, hogy megkapjuk az független, azonos eloszlású változók sorozatát. Következőként választunk egy -t és -et partícionáljuk (diszjunkt) részhalmazra. A partíciókat -vel jelöljük, ahol . Következő lépésként definiáljuk az valószínűségi változók sorozatát: akkor és csak akkor, ha , és esetén.
Bizonyítsuk be, hogy egy polinomiális kísérletsorozat és paraméterrel, ahol esetén!
Jelölje azt az állítást, hogy eloszlása egy adott, teljesen meghatározott eloszlás. Jelölje a sűrűségfüggvényt -n: esetén. A hipotézis teszteléséhez formálisan tesztelhetjük versus -t, ami természetesen pontosan az a probléma, amit megoldottunk az egymintás polinomiális modellben.
Általánosan, az teret annyi részhalmazra bonthatjuk, amenyire lehetséges, azzal a megszorítással, hogy az elvárt gyakoriság legalább öt legyen minden részhalmazra.
Gyakran nem akarjuk azt tesztelni, hogy eloszlása egy teljesen meghatározott eloszlás (pl. normális eloszlás 5 várható értékkel és 9 szórásnégyzettel), hanem inkább azt, hogy eloszlása egy meghatározott paraméteres családhoz tartozik-e (pl. normális). Ebben az esetben a kézenfekvő eljárás az ismeretlen paraméterek becslése, és aztán a fent leírt módszert követni. Ahogy az előbb láttuk, az elvárt gyakoriságok, -k, statisztikák, mivel a becsült paramétereken alapulnak. Általában a khi-négyzet statisztika szabadságfokánál minden becsült paraméterre egy szabadságfokot vesztünk, bár ennek precíz matematikai bizonyítása nehéz lehet.
Tegyük fel, hogy és megfigyelhető valószínűségi változók egy kísérletre, ahol egy elemű halmazbeli értékeket vesz fel, és egy elemű halmazbeli értékeket vesz fel. Jelölje együttes sűrűségfüggvényét, azaz és esetén. Idézzük fel, hogy illetve marginális sűrűségfüggvényei a illetve függvények, ahol Természetesen rendszerint , és ismeretlenek. Ebben a szakaszban az érdekel minket, hogy vajon és függetlenek-e, ami egy alapvető és fontos próba. Formálisan a nullhipotézist akarjuk tesztelni az ellentétes hipotézissel szemben.
Az első lépés természetesen egy minta vétele eloszlásából. Mivel az állapotterek végesek, ez a minta polinomiális próba sorozatot alkot. Így a szokásos jelölésünkkel jelölje annak a számát, hogy előfordul a mintában, minden esetén. Ez a statisztika binomiális eloszlású kísérletparaméterrel és sikerparaméterrel. A mellett a sikerparaméter . Viszont mivel nem ismerjük a sikerparamétereket, becsülnünk kell azokat annak érdekében, hogy kiszámíthassuk az elvárt gyakoriságokat. legjobb becslése az mintaarány. Így illetve legjobb becslése illetve , ahol az előfordulásának száma az mintában és a előfordulásának száma az mintában: Így várt gyakoriságának becslése mellett: Természetesen a próbafüggvényt definiálja. Ahogy várjuk, eloszlása khi-négyzet eloszláshoz konvergál, ha . Nézzük, hogy meg tudjuk-e határozni a megfelelő szabadságfokot heurisztikus alapokon!
Bizonyítsuk be, hogy határeloszlásának szabadságfoka
Mutassuk meg, hogy versus egy közelítő próbája szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha
A megfigyelt értékeket gyakran egy -es táblázatba jegyezzük fel, amit kontingencia táblázatnak hívunk; az -edik sorban és a -edik oszlopban szereplő szám. Ebben az esetben a gyakoriságok összege az -edik sorban és a gyakoriságok összege a -edik oszlopban. Történelmi okok miatt néha az és valószínűségi változókat faktoroknak hívjuk és a változók lehetséges értékeit kategóriáknak.
A következő feladatok mindegyikében határozzuk meg a khi-négyzet statisztika szabadságfokát, adjuk meg a statisztika értékét és számítsuk ki a próba -értékét!
Egy pénzérmét százszor feldobunk és 55 fejet kapunk. Teszteljük azt a nullhipotézist, hogy az érme szabályos!
Tegyük fel, hogy van három érménk. Az érméket feldobjuk, az eredmények a következők:
Fej | Írás | |
---|---|---|
1. érme | 29 | 21 |
2. érme | 23 | 17 |
3. érme | 42 | 18 |
Egy kockával dobunk 240 alkalommal, az eredmények a következők:
Pont | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Gyakoriság | 57 | 39 | 28 | 28 | 36 | 52 |
Két kockával dobunk, az eredmények a következők:
Pont | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
1. kocka | 22 | 17 | 22 | 13 | 22 | 24 |
2. kocka | 44 | 24 | 19 | 19 | 18 | 36 |
A Buffon kísérlet adathalmaz tartalmazza a Buffon-féle tű kísérlet 104 ismétlésének eredményét. A keresztezések száma 56. Elméletben ennek az adathalmaznak meg kellene felelni 104 db sikerparaméterű Bernoulli kísérlet eredményének. Ellenőrizzük, hogy ez elfogadható-e!
Egy rádióaktív anyag bomló részecskéit figyeljük meg, száz darab egy másodperces intervallumra veszünk mintát. A következő táblázatban találjuk a bomlások gyakoriságának eloszlást:
Darab | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Gyakoriság | 3 | 1 | 2 | 12 | 23 | 13 | 20 | 9 | 6 | 6 | 4 | 1 |
Egy egyetem osztályozást végez beosztás (instruktor, adjunktus, docens és professzor) szerint. Az adatokat beosztás és nem szerint a következő kontingencia táblázat tartalmazza. Teszteljük, hogy a beosztás és a nem függetlenek!
Beosztás | Instruktor | Adjunktus | Docens | Professzor |
---|---|---|---|---|
Férfi | 62 | 238 | 185 | 115 |
Nő | 118 | 122 | 123 | 37 |
Teszteljük, hogy a Michelson fénysebesség adatok normális eloszlásból származnak-e!
Az alábbi szimulációs gyakorlatokban lehetősége nyílik az illeszkedésvizsgálat megismerésére.
A kocka illeszkedésvizsgálati kísérletben állítsuk be a mintaeloszlást szabályosra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?
A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást egyes-hatos lapos kockára, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?
A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást szimmetrikus, unimodális eloszlásra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?
A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást jobbra ferdülő eloszlásra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?
Tegyük fel, hogy és különböző eloszlások. A próba ereje megegyezik-e abban az esetben, ha a mintavételezett eloszlás és a teszt eloszlás, azzal, ha a mintavételezett eloszlás és a teszt eloszlás? Állítsunk fel egy sejtést a 24-26. feladatok alapján!
A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást és a teszteloszlást szabályosra és a szignifikancia szintet 0,05-ra! Futtassuk a kísérletet ezerszer a következő mintanagyságokra! Minden esetben adjuk meg a szignifikancia szint empirikus becslését és hasonlítsuk össze 0,05-dal!
A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást szabályosra, a teszteloszlást egyes-hatos lapos kockára, a szignifikancia szintet 0,05-ra! Futtassuk a kísérletet ezerszer a következő mintanagyságokra! Minden esetben adjuk meg a próba erejének tapasztalati becslését! Tapasztalunk konvergenciát?