Khi-négyzet próbák

Ebben az alfejezetben számos fontos hipotézis próbát fogunk tanulmányozni, melyeket általánosan khi-négyzet próbáknak hívunk. Ahogy kitalálható, ez az elnevezés arra utal, hogy ezekre az esetekre a próbafüggvény (határértékben) khi-négyzet eloszlású. Bár több különböző próba esik ebbe az általános kategóriába, mindegyikükben közösek a következők:

Témakörök

Az egymintás Bernoulli modell

Tegyük fel, hogy

X X 1 X 2 X n

egy véletlen minta a Bernoulli eloszlásból ismeretlen

p 01

sikerparaméterrel. Így ezek független valószínűségi változók, amik az 1 illetve a 0 értéket veszik fel

p

illetve

1 p

valószínűséggel. A

p p 0

versus

p p 0

hipotézist akarjuk tesztelni, ahol

p 0 01

adott. Természetesen már tanulmányoztunk ilyen próbákat a Hipotézisvizsgálat a Bernoulli modellben alfejezetben. De tartsuk észben, hogy ezek a módszerek elvezetnek olyan új modellekhez, amiket még nem tanulmányoztunk.

Legyen

O 1 j 1 n X j

és

O 0 n O 1 j 1 n 1 X j

. Ezek a statisztikák megadják az 1-ek illetve 0-k előfordulásainak számát (a gyakoriságot). Továbbá tudjuk, hogy mindkettő binomiális eloszlású;

O 1

paraméterei

n

és

p

, míg

O 0

paraméterei

n

és

1 p

. Speciálisan,

O 1 n p

O 0 n 1 p

, és

O 1 O 0 n p 1 p

. Továbbá idézzük fel, hogy

O 1

elégséges

p

-re. Így minden jó próbafüggvénynek

O 1

függvényének kell lenni. Továbbá emlékezzünk arra, hogy ha

n

nagy, akkor

O 1

eloszlása közelítően normális a centrális határeloszlás tétel szerint. Legyen

Z O 1 n p 0 n p 0 1 p 0

Jegyezzük meg, hogy

Z

O 1

standardizáltja

mellett. Így, ha

n

nagy,

Z

közelítően standard normális eloszlású

mellett, és emiatt

V Z 2

közelítően khi-négyzet eloszlású 1 szabadságfokkal

mellett. Szokás szerint jelölje

k

k

szabadságfokú khi-négyzet eloszlás kvantilis függvényét.

Mutassuk meg, hogy versus közelítő próbája $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V 1 1 α$ .

Mutassuk meg, hogy az 1. feladatban szereplő próba ekvivalens a $Z$ próbafüggvényű torzítatlan próbával (a közelítő normális próba), amit a Hipotézisvizsgálat a Bernoulli modellben alfejezetben határoztunk meg!

A következő feladat kritikus eredménye

V

speciális reprezentációja az általánosítás érdekében. Legyen

e 0 n 1 p 0

és legyen

e 1 n p 0

. Jegyezzük meg, hogy ezek a 0-k illetve az 1-ek elvárt gyakoriságai

mellett.

Mutassuk meg, hogy $V O 0 e 0 2 e 0 O 1 e 1 2 e 1$

Ez a reprezentáció azt mutatja, hogy a

V

próbafüggvényünk a

melletti elvárt gyakoriságok és a megfigyelt gyakoriságok közti eltérést méri. Természetesen

V

nagy értéke bizonyíték

mellett. Végül jegyezzük meg, hogy bár két tag szerepel

V

kifejtésében a 3. feladatban, de csak egy a szabadságfok, mivel

O 0 O 1 n

. A megfigyelt és az elvárt gyakoriságok egy

12

-es táblázatban tárolhatók.

A többmintás Bernoulli modell

Tegyük fel, hogy van néhány mintánk néhány (esetleg) különböző, független Bernoulli kísérlet folyamatból. Speciálisan tegyük fel, hogy

X i X i 1 X i 2 X i n i

egy

n i

elemű véletlen minta a Bernoulli eloszlásból ismeretlen

p i 01

sikerparaméterrel minden

i 12 m

esetén. Továbbá az

X 1 X 2 X m

minták függetlenek. Az ismeretlen

p p 1 p 2 p m

paramétervektorra vonatkozó hipotézist akarjuk tesztelni. Két gyakori eset van, amit megvizsgálunk, de először bevezetünk egy lényeges jelölést, amire mindkét esetnél szükségünk lesz.

i 12 m

és

j 01

esetén jelölje

O i j

azt, hogy

j

hányszor fordult elő az

X i

mintában. A megfigyelt gyakoriság

O i j

binomiális eloszlású;

O i 1

n i

és

p i

paraméterekkel, míg

O i 0

n i

és

1 p i

paraméterekkel.

A teljesen meghatározott eset

Tekintsünk egy adott

p 0 p 01 p 02 p 0 m 01 m

paramétervektort. A következő hipotézist kívánjuk tesztelni:

p p 0

, versus

p p 0

. Mivel a nullhipotézis meghatározza

p i

értékeit minden

i

esetén, ezt teljesen meghatározott esetnek hívjuk. Most legyen

e i 0 n i 1 p i 0

és

e i 1 n i p i 0

. Ezek az értékek a 0-k illetve az 1-ek várt gyakoriságai a

X i

mintából

mellett.

Felhasználva a 3. feladatot és a függetlenséget, mutassuk meg, hogy ha $n i$ nagy minden $i$ esetén, akkor $V i 1 m j 01 O i j e i j 2 e i j$ eloszlása közelítően khi-négyzet eloszlás $m$ szabadságfokkal!

Hozzávetőlegesen a nagy azt jelenti, hogy

e i j 5

minden

i 12 m

és

j 01

esetén. De természetesen minél nagyobbak ezek az elvárt gyakoriságok, annál jobb.

Nagy minta feltételezése mellett mutassuk meg, hogy egy közelítő próba versus -re $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V m 1 α$

Még egyszer megjegyezzük, hogy a

V

próbafüggvény az elvárt és a megfigyelt gyakoriságok közti eltérést méri minden kimenet és minden minta esetén.

2 m

tag szerepel

V

kifejtésében a 4. feladatban, de csak

m

a szabadságfok, mivel

O i 0 O i 1 n i

minden

i 12 m

esetén. A megfigyelt és az elvárt gyakoriságok egy

m 2

-es táblázatban tárolhatók.

Az egyenlő valószínűségű eset

Tegyük fel, hogy a

p 1 p 2 p m

nullhipotézist akarjuk tesztelni, azaz az összes siker-valószínűség megegyezik, a

alternatív hipotézissel szemben, mely szerint nem minden valószínűség ugyanaz. Jegyezzük meg, hogy szemben az előző modellel, a nullhipotézis nem határozza meg a közös sikerparamétert,

p

-t. De jegyezzük meg, hogy a nullhipotézis mellett az

m

minta összevonható egy Bernoulli kísérletekből származó nagy mintává

p

sikerparaméterrel. Így a természetes megközelítés: először

p

-t becsülni, aztán meghatározni a próbafüggvényt, ami méri az eltérést az elvárt és a megfigyelt gyakoriságok közt, ahogy eddig. A kihívás a próbafüggvény eloszlásának megtalálása.

Jelölje

n i 1 m n i

a mintanagyságot, amikor a mintákat összevontuk. Ekkor az összesített mintaátlag, ami ebben az esetben a sikerek összesített részaránya:

P 1 n i 1 m j 1 n i X i j 1 n i 1 m O i 1

P

minta-gyakoriság

p

legjobb becslése, a szó minden értelmében. Továbbá legyen

E i 0 n i 1 P

és

E i 1 n i P

. Ezek a 0-k illetve 1-ek becsült elvárt gyakoriságai az

i

mintából

mellett. Természetesen ezek a becsült gyakoriságok most statisztikák (és így véletlenek), nem paraméterek. Az előzőeknek megfelelően definiáljuk a próbafüggvényt:

V i 1 m j 01 O i j E i j 2 E i j

Kiderült, hogy

mellett

V

eloszlása khi-négyzet eloszláshoz tart

m 1

szabadságfokkal, ahogy

n

Mutassuk meg, hogy egy közelítő próba versus -re $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V m 1 1 α$

Intuitívan, elvesztettünk egy szabadságfokot a teljesen meghatározott esethez képest, mivel becsülnünk kell az ismeretlen

p

sikerparamétert. A megfigyelt és az elvárt gyakoriságok ismét egy

m 2

-es táblázatban tárolhatók.

Az egymintás polinomiális modell

A következő modellünk az egymintás Bernoulli modellt általánosítja egy másik irányba. Tegyük fel, hogy

X X 1 X 2 X n

polinomiális kísérletek sorozata. Így ezek független, azonos eloszlású valószínűségi változók, mindegyik egy

k

elemű

S

halmazbeli értéket vehet fel. Ha akarjuk, feltételezhetjük, hogy

S 01 k 1

; az egymintás Bernoulli modell

k 2

-nek felel meg. Jelölje

f

a mintaváltozók közös sűrűségfüggvényét

S

-en, így

f j X i j

i 12 n

és

j S

esetén.

f

értékeit ismeretlennek tételezzük fel, de természetesen

j S f j 1

, tehát valójában

k 1

ismeretlen paraméterünk van. Egy

S

-en adott

f 0

sűrűségfüggvény esetén a

f f 0

versus

f f 0

hipotézist akarjuk tesztelni.

Mostanra világosnak kell lenni az általános megközelítésünknek.

O j

-vel jelöljük, hogy

j

hányszor fordul elő az

X

mintában. Jegyezzük meg, hogy

O j

binomiális eloszlású

n

és

f j

paraméterekkel. Így

e j n f 0 j

j

előfordulásainak várható száma

mellett. A próbafüggvényünk természetesen

V j S O j e j 2 e j

Kiderült, hogy

mellett

V

eloszlása khi-négyzet eloszláshoz tart

k 1

szabadságfokkal, ahogy

n

. Jegyezzük meg, hogy

k

tag szerepel

V

kifejtésében, de csak

k 1

a szabadságfok, mivel

i 1 n O i n

Mutassuk meg, hogy egy közelítő próba versus -re $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V k 1 1 α$

Általában az szükséges, hogy

e j 5

minden

j S

esetén, de a nagyobb elvárt gyakoriságok jobbak.

A többmintás polinomiális modell

Ahogy kitalálható volt, az utolsó általánosítás a többmintás polinomiális modell. Speciáliasan tegyük fel, hogy

X i X i 1 X i 2 X i n i

egy

n i

elemű véletlen minta egy

S

halmazon, ami

k

elemű, minden

i 12 m

-re. Továbbá feltesszük, hogy az

X 1 X 2 X m

minták függetlenek. Az általánosság megszorítása nélkül legyen

S 01 k 1

. Ekkor

k 2

a többmintás Bernoulli modellre redukálódik, és

m 1

megfelel az egymintás polinomiális modellnek.

Jelölje

f i

a változók közös sűrűségfüggvényét az

X i

mintában, azaz

f i j X i l j

i 12 m

l 12 n i

és

j S

esetén. Ezek általában ismeretlenek, így a paramétervektorunk a sűrűségfüggvények vektora:

f f 1 f 2 f m

. Természetesen

j S f i j 1

i 12 m

esetén, tehát ténylegesen

m k 1

ismeretlen paraméterünk van. Az

f

-re vonatkozó hipotézis tesztelése érdekel minket. Ahogy a többmintás Bernoulli modellben, két alapeset van, amit megvizsgálunk, de előbb bevezetjük az alapvető jelölést, amire mindkét esetben szükségünk lesz:

i 12 m

és

j S

esetén jelölje

O i j

j

kimenetek számát az

X i

mintában. A megfigyelt gyakoriság,

O i j

binomiális eloszlású

n i

és

f i j

paraméterekkel.

A teljesen meghatározott eset

Tekintsünk egy adott sűrűségfüggvény vektort

S

-en, jelölje

f 0 f 01 f 02 f 0 m

. A

f f 0

versus

f f 0

hipotézist akarjuk tesztelni. Mivel a nullhipotézis meghatározza

f i j

értékeit minden

i

-re és

j

-re, ezt az esetet teljesen meghatározott esetnek hívjuk. Legyen

e i j n i f 0 i j

. Ez a várt gyakorisága a

j

kimeneteknek az

X i

mintában

mellett.

Használjuk az egymintás polinomiális eset eredményét és a függetlenséget, hogy megmutassuk, ha $n i$ nagy minden $i$ -re, akkor $V i 1 m j S O i j e i j 2 e i j$ közelítően khi-négyzet eloszlású $m k 1$ szabadságfokkal!

Szokás szerint az a jó, ha

e i j 5

minden

i 12 m

-re és

j S

-re. Természetesen minél nagyobbak ezek a várt gyakoriságok, annál jobb.

Nagy minta feltételezése mellett mutassuk meg, hogy egy közelítő próba versus -re $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V m k 1 1 α$

Ahogy mindig, a

V

próbafüggvény az elvárt és a megfigyelt gyakoriságok közti eltérést méri minden kimenet és minden minta esetén.

m k

tag van

V

kifejtésében a 8. feladat szerint, de

m

szabadságfokot elvesztünk, mivel

j S O i j n i

minden

i 12 m

-re.

Az egyenlő sűrűségfüggvény esete

Tegyük fel, hogy a

f 1 f 2 f m

nullhipotézist akarjuk tesztelni, azaz az összes sűrűségfüggvény megegyezik, a

alternatív hipotézissel szemben, hogy nem minden sűrűségfüggvény ugyanaz. Jegyezzük meg, hogy szemben az előző modellel, a nullhipotézis nem határozza meg a közös sűrűségfüggvényt,

f

-et. De jegyezzük meg, hogy a nullhipotézis mellett az

m

minta összevonható egy nagy mintává, ami polinomiális kísérletekből származik

f

sűrűségfüggvénnyel. Így a természetes megközelítés: először

f

értékeit becsülni, aztán definiálni a próbafüggvényt, ami az eltérést méri a várt és a megfigyelt gyakoriságok közt, ahogy eddig.

Jelölje

n i 1 m n i

az összevont minták mintanagyságát. A

mellett

f j

legjobb becslése

P j 1 n i 1 m O i j

Így az

X i

minta esetén a

j

kimenet várt gyakoriságának becslése

mellett

E i j n i P j

. Ez a becsült gyakoriság ismét statisztika (és így véletlen), és nem paraméter. Akárcsak előbb, a próbafüggvény

V i 1 m j S O i j E i j 2 E i j

Ahogy mostanra már nem lehet kétségünk,

mellett

V

eloszlása khi-négyzet eloszláshoz konvergál, ahogy

n

. De nézzük, meg tudjuk-e határozni a szabadságfokot heurisztikusan.

Bizonyítsuk be, hogy $V$ határeloszlása $k 1 m 1$ szabadságfokú!

$k m$ tag van $V$ kifejtésében.
Elvesztünk $m$ szabadságfokot, mivel $j S O i j n i$ minden $i 12 m$ esetén.
Egy kivételével az összes $f j$ valószínűséget becsülni kell $j S$ esetén, így vesztünk $k 1$ szabadságfokot.

Mutassuk meg, hogy versus közelítő próbája $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V k 1 m 1 1 α$

Illeszkedésvizsgálat

Az illeszkedésvizsgálat annak eldöntésére szolgál, hogy egy ismeretlen mintavételezett eloszlás megegyezik-e egy speciális, meghatározott eloszlással, vagy egy paraméteres eloszláscsaládhoz tartozik-e. Az ilyen próbák nyilvánvalóan alapvetőek és fontosak. Az egymintás polinomiális modell egy elég általános illeszkedésvizsgálati próbához vezet.

Kiindulásként tegyük fel, hogy van egy

X

megfigyelhető valószínűségi változónk egy kísérletből, ami egy általános

S

halmazbeli értékeket vesz fel. Az

X

valószínűségi változó lehet folytonos vagy diszkrét eloszlású és lehet egy- vagy többváltozós. Azt a nullhipotézist akarjuk tesztelni, hogy

X

eloszlása egy adott, teljesen meghatározott eloszlás, vagy hogy

X

eloszlása egy adott paraméteres családhoz tartozik.

Mindkét esetben első lépésként mintavételezzük

X

-et, hogy megkapjuk az

X X 1 X 2 X n

független, azonos eloszlású változók sorozatát. Következőként választunk egy

k

-t és

S

-et partícionáljuk

k

(diszjunkt) részhalmazra. A partíciókat

A j j J

-vel jelöljük, ahol

J k

. Következő lépésként definiáljuk az

Y Y 1 Y 2 Y n

valószínűségi változók sorozatát:

Y i j

akkor és csak akkor, ha

X i A j

i 12 n

és

j J

esetén.

Bizonyítsuk be, hogy $Y$ egy polinomiális kísérletsorozat $n$ és $f$ paraméterrel, ahol $f j X A j$ $j J$ esetén!

A teljesen meghatározott eset

Jelölje

H

azt az állítást, hogy

X

eloszlása egy adott, teljesen meghatározott eloszlás. Jelölje

f 0

a sűrűségfüggvényt

J

-n:

f 0 j X A j H

j J

esetén. A

H

hipotézis teszteléséhez formálisan tesztelhetjük

f f 0

versus

f f 0

-t, ami természetesen pontosan az a probléma, amit megoldottunk az egymintás polinomiális modellben.

Általánosan, az

S

teret annyi részhalmazra bonthatjuk, amenyire lehetséges, azzal a megszorítással, hogy az elvárt gyakoriság legalább öt legyen minden részhalmazra.

A részben meghatározott eset

Gyakran nem akarjuk azt tesztelni, hogy

X

eloszlása egy teljesen meghatározott eloszlás (pl. normális eloszlás 5 várható értékkel és 9 szórásnégyzettel), hanem inkább azt, hogy

X

eloszlása egy meghatározott paraméteres családhoz tartozik-e (pl. normális). Ebben az esetben a kézenfekvő eljárás az ismeretlen paraméterek becslése, és aztán a fent leírt módszert követni. Ahogy az előbb láttuk, az elvárt gyakoriságok,

E j

-k, statisztikák, mivel a becsült paramétereken alapulnak. Általában a

V

khi-négyzet statisztika szabadságfokánál minden becsült paraméterre egy szabadságfokot vesztünk, bár ennek precíz matematikai bizonyítása nehéz lehet.

Függetlenségvizsgálat

Tegyük fel, hogy

X

és

Y

megfigyelhető valószínűségi változók egy kísérletre, ahol

X

egy

k

elemű

S

halmazbeli értékeket vesz fel, és

Y

egy

m

elemű

T

halmazbeli értékeket vesz fel. Jelölje

f

X Y

együttes sűrűségfüggvényét, azaz

f i j X i Y j

i S

és

j T

esetén. Idézzük fel, hogy

X

illetve

Y

marginális sűrűségfüggvényei a

g

illetve

h

függvények, ahol

g i j T f i j, i S

h j i S f i j, j T

Természetesen rendszerint

f

g

és

h

ismeretlenek. Ebben a szakaszban az érdekel minket, hogy vajon

X

és

Y

függetlenek-e, ami egy alapvető és fontos próba. Formálisan a

f i j g i h j minden i j S T

nullhipotézist akarjuk tesztelni az ellentétes

hipotézissel szemben.

Az első lépés természetesen egy

X Y X 1 Y 1 X 2 Y 2 X n Y n

minta vétele

X Y

eloszlásából. Mivel az állapotterek végesek, ez a minta polinomiális próba sorozatot alkot. Így a szokásos jelölésünkkel jelölje

O i j

annak a számát, hogy

i j

előfordul a mintában, minden

i j S T

esetén. Ez a statisztika binomiális eloszlású

n

kísérletparaméterrel és

f i j

sikerparaméterrel. A

mellett a sikerparaméter

g i h j

. Viszont mivel nem ismerjük a sikerparamétereket, becsülnünk kell azokat annak érdekében, hogy kiszámíthassuk az elvárt gyakoriságokat.

f i j

legjobb becslése az

1 n O i j

mintaarány. Így

g i

illetve

h j

legjobb becslése

1 n N i

illetve

1 n M j

, ahol

N i

i

előfordulásának száma az

X

mintában és

M j

j

előfordulásának száma az

Y

mintában:

N i j T O i j

M j i S O i j

Így

i j

várt gyakoriságának becslése

mellett:

E i j n 1 n N i 1 n M j 1 n N i M j

Természetesen a próbafüggvényt

V i S j T O i j E i j 2 E i j

definiálja. Ahogy várjuk,

V

eloszlása khi-négyzet eloszláshoz konvergál, ha

n

. Nézzük, hogy meg tudjuk-e határozni a megfelelő szabadságfokot heurisztikus alapokon!

Bizonyítsuk be, hogy $V$ határeloszlásának szabadságfoka $k 1 m 1$

$k m$ tag van $V$ kifejtésében.
Egy szabadságfokot vesztünk, mivel $i S j T O i j n$ ,
Egy kivételével az összes $g i$ valószínűséget becsülni kell $i S$ esetén, így $k 1$ szabadságfokot vesztünk.
Egy kivételével az összes $h j$ valószínűséget becsülni kell $j T$ esetén, így $m 1$ szabadságfokot vesztünk.

Mutassuk meg, hogy versus egy közelítő próbája $α$ szignifikancia szinten: Elutasítjuk -t akkor és csak akkor, ha $V k 1 m 1 1 α$

A megfigyelt értékeket gyakran egy

k m

-es táblázatba jegyezzük fel, amit kontingencia táblázatnak hívunk;

O i j

i

-edik sorban és a

j

-edik oszlopban szereplő szám. Ebben az esetben

N i

a gyakoriságok összege az

i

-edik sorban és

M j

a gyakoriságok összege a

j

-edik oszlopban. Történelmi okok miatt néha az

X

és

Y

valószínűségi változókat faktoroknak hívjuk és a változók lehetséges értékeit kategóriáknak.

Számítási és szimulációs feladatok

Számítási feladatok

A következő feladatok mindegyikében határozzuk meg a khi-négyzet statisztika szabadságfokát, adjuk meg a statisztika értékét és számítsuk ki a próba

P

-értékét!

Egy pénzérmét százszor feldobunk és 55 fejet kapunk. Teszteljük azt a nullhipotézist, hogy az érme szabályos!

Tegyük fel, hogy van három érménk. Az érméket feldobjuk, az eredmények a következők:

	Fej	Írás
1. érme	29	21
2. érme	23	17
3. érme	42	18

Teszteljük azt a nullhipotézist, hogy mindhárom érme szabályos!
Teszteljük azt a nullhipotázist, hogy mindhárom érme esetén ugyanannyi a fej valószínűsége!

Egy kockával dobunk 240 alkalommal, az eredmények a következők:

Pont	1	2	3	4	5	6
Gyakoriság	57	39	28	28	36	52

Teszteljük azt a nullhipotézist, hogy a kocka szabályos!
Teszteljük azt a nullhipotézist, hogy a kocka egy ún. "egyes-hatos lapos kocka" (az 1 és a 6 valószínűsége $1 4$ , míg a 2, 3, 4 és 5 valószínűsége $1 8$ )!

Két kockával dobunk, az eredmények a következők:

Pont	1	2	3	4	5	6
1. kocka	22	17	22	13	22	24
2. kocka	44	24	19	19	18	36

Teszteljük azt a nullhipotézist, hogy az első kocka szabályos, míg a második kocka egy "egyes-hatos lapos kocka"!
Teszteljük azt a nullhipotézist, hogy mindkét kockának ugyanaz a valószínűségi eloszlása!

A Buffon kísérlet adathalmaz tartalmazza a Buffon-féle tű kísérlet 104 ismétlésének eredményét. A keresztezések száma 56. Elméletben ennek az adathalmaznak meg kellene felelni 104 db $p 2$ sikerparaméterű Bernoulli kísérlet eredményének. Ellenőrizzük, hogy ez elfogadható-e!

Egy rádióaktív anyag bomló részecskéit figyeljük meg, száz darab egy másodperces intervallumra veszünk mintát. A következő táblázatban találjuk a bomlások gyakoriságának eloszlást:

Darab	0	1	2	3	4	5	6	7	8	9	10	11
Gyakoriság	3	1	2	12	23	13	20	9	6	6	4	1

Teszteljük le, hogy az adatok származhatnak-e 5 paraméterű Poisson eloszlásból!
Teszteljük le, hogy az adatok származhatnak-e Poisson eloszlásból!

Egy egyetem osztályozást végez beosztás (instruktor, adjunktus, docens és professzor) szerint. Az adatokat beosztás és nem szerint a következő kontingencia táblázat tartalmazza. Teszteljük, hogy a beosztás és a nem függetlenek!

Beosztás	Instruktor	Adjunktus	Docens	Professzor
Férfi	62	238	185	115
Nő	118	122	123	37

Teszteljük, hogy a Michelson fénysebesség adatok normális eloszlásból származnak-e!

Szimulációs gyakorlatok

Az alábbi szimulációs gyakorlatokban lehetősége nyílik az illeszkedésvizsgálat megismerésére.

A kocka illeszkedésvizsgálati kísérletben állítsuk be a mintaeloszlást szabályosra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?

szabályos
egyes-hatos lapos
szimmetrikus, unimodális eloszlás
az eloszlás jobbra ferdül

A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást egyes-hatos lapos kockára, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?

szabályos
egyes-hatos lapos kocka
szimmetrikus, unimodális eloszlás
az eloszlás jobbra ferdül

A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást szimmetrikus, unimodális eloszlásra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?

szimmetrikus, unimodális eloszlás
szabályos
egyes-hatos lapos kocka
az eloszlás jobbra ferdül

A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást jobbra ferdülő eloszlásra, a mintanagyságot 50-re, a szignifikancia szintet 0,1-re! Állítsuk be a teszt eloszlást a lent jelzettekre, és minden esetben futtassuk a szimulációt ezerszer! Az (a) esetben adjuk meg a próba szignifikancia szintjének tapasztalati becslését és hasonlítsuk össze 0,1-del! A többi esetben adjuk meg a próba erejének tapasztalati becslését! A (b)-(d) esetekben rangsoroljuk az eloszlásokat a látszólagos erő szerint növekvőleg! Elfogadhatónak tűnnek az eredmények?

az eloszlás jobbra ferdül
szabályos
egyes-hatos lapos kocka
szimmetrikus, unimodális eloszlás

Tegyük fel, hogy $D 1$ és $D 2$ különböző eloszlások. A próba ereje megegyezik-e abban az esetben, ha $D 1$ a mintavételezett eloszlás és $D 2$ a teszt eloszlás, azzal, ha $D 2$ a mintavételezett eloszlás és $D 1$ a teszt eloszlás? Állítsunk fel egy sejtést a 24-26. feladatok alapján!

A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást és a teszteloszlást szabályosra és a szignifikancia szintet 0,05-ra! Futtassuk a kísérletet ezerszer a következő mintanagyságokra! Minden esetben adjuk meg a szignifikancia szint empirikus becslését és hasonlítsuk össze 0,05-dal!

$n 10$
$n 20$
$n 40$
$n 100$

A kocka illeszkedésvizsgálat kísérletben állítsuk be a mintaeloszlást szabályosra, a teszteloszlást egyes-hatos lapos kockára, a szignifikancia szintet 0,05-ra! Futtassuk a kísérletet ezerszer a következő mintanagyságokra! Minden esetben adjuk meg a próba erejének tapasztalati becslését! Tapasztalunk konvergenciát?

$n 10$
$n 20$
$n 40$
$n 100$

6. Khi-négyzet próbák

Témakörök

Az egymintás Bernoulli modell

A többmintás Bernoulli modell

A teljesen meghatározott eset

Az egyenlő valószínűségű eset

Az egymintás polinomiális modell

A többmintás polinomiális modell

A teljesen meghatározott eset

Az egyenlő sűrűségfüggvény esete

Illeszkedésvizsgálat

A teljesen meghatározott eset

A részben meghatározott eset

Függetlenségvizsgálat

Számítási és szimulációs feladatok

Számítási feladatok

Szimulációs gyakorlatok