]> Likelihood hányados próbák
  1. Virtual Laboratories
  2. 8. Hipotézisvizsgálat
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7

5. Likelihood hányados próbák

Bevezetés

Szokás szerint, a kiindulási pontunk egy véletlen kísérlet az alapjául szolgáló mintatérrel és egy valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető X valószínűségi változó, ami S halmazbeli értékeket vesz fel. Általánosságban X elég bonyolult struktúrájú lehet. Például, ha a kísérlet n objektum mintavételezése egy populációból, és különböző mérőszámokat jegyzünk fel, akkor

X X 1 X 2 X n

ahol X i az i -edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor X 1 X 2 X n függetlenek és azonos eloszlásúak. Ebben az esetben egy n elemű véletlen mintánk van a közös eloszlásból.

Az előző részekben különböző paraméterekre természetes próbafüggvényeken alapuló próbákat fejlesztettünk. Viszont más esetekben a próbák nem feltétlenül paraméteresek, vagy nem találunk egy nyilvánvaló statisztikát, amivel kezdhetünk. Így egy általánosabb módszerre van szükségünk próbafüggvények konstruálásához. Továbbá nem tudjuk, hogy az eddigi próbáink a legjobbak-e abban az értelemben, hogy maximalizálják az erőt az alternatívák halmazára. Ebben és a következő részben mindkét gondolatot megvizsgáljuk. A likelihood függvények hasonlóak azokhoz, mint amiket a maximum likelihood becslés esetén használtunk; és ezek kulcsszerepet fognak játszani.

Próbák egyszerű hipotézisre

Tegyük fel, hogy X -nek két lehetséges eloszlása lehet. Az egyszerű hipotézisünk:

X  sűrűségfüggvénye   f 0  versus  X  sűrűségfüggvénye   f 1

Alsó indexeket fogunk használni a valószínűségi mérték esetén, hogy jelöljük a két hipotézist. A próba, amit konstruálni fogunk, a következő egyszerű ötleten alapul: ha a megfigyelésünk X x , akkor az f 1 x f 0 x feltétel bizonyíték az alternatív hipotézis mellett; az ellenkező egyenlőtlenség bizonyíték az alternatív hipotézis ellen. Így legyen

L x f 0 x f 1 x ,  x S

Az L függvény a likelihood hányados függvény a hipotézisre és L X a likelihood hányados statisztika. Újra megfogalmazva korábbi megállapításunkat, jegyezzük meg, hogy L kis értékei bizonyítékok mellett. Így elfogadhatónak látszik, hogy a likelihood statisztika egy jó próbafüggvény lehet, és a következő alakú próbákat kell megvizsgálnunk, ahol k egy konstans:

Elutasítjuk  -t  akkor és csak akkor, ha   L k

Mutassuk meg, hogy a próba szignifikancia szintje α 0 L k !

Szokás szerint megpróbálhatunk megkonstruálni egy próbát k olyan választásával, hogy α egy előre megadott érték legyen. Ha X diszkrét eloszlású, ez csak akkor lehetséges, ha α az L X eloszlásfüggvényének egy értéke.

Fontos speciális esete a modellnek, amikor X eloszlása egy olyan θ paramétertől függ, aminek két lehetséges értéke van. Így a paramétertér Θ θ 0 θ 1 , és f 0 jelöli X sűrűségfüggvényét, amikor θ θ 0 , és f 1 jelöli X sűrűségfüggvényét, amikor θ θ 1 . Ebben az esetben a hipotézis ekvivalens a következővel:

θ θ 0  versus  θ θ 1

A Neyman-Pearson lemma

A következő feladatok megalapozzák a Neyman-Pearson lemmát, ami Jerzy Neymanról és Egon Pearsonról van elnevezve. Az eredmény megmutatja, hogy a fent adott próba a legerősebb. Legyen

R x S L x k

Használjuk fel L és R definícióját, hogy megmutassuk:

  1. 0 X A k 1 X A A R esetén
  2. 0 X A k 1 X A A R c esetén

Mutassuk meg: ha A S , akkor

1 X R 1 X A 1 k 0 X R 0 X A

Útmutatás: Használjuk fel, hogy R R A R A és A A R A R ! Használjuk a valószínűség additivitását és a 2. feladat eredményeit!

Tekintsük a próbákat az R illetve az A elutasítási tartományokkal! Idézzük fel, az elutasítási tartomány mérete a próba szignifikancia szintje azzal a tartománnyal! Használjuk a 3. feladatot, hogy megmutassuk, hogy ha R mérete legalább akkora, mint A mérete, akkor a próba az R elutasítási tartománnyal erősebb, mint a próba az A elutasítási tartománnyal:

0 X R 0 X A 1 X R 1 X A

A Neyman-Pearson lemma egy szép eredmény és fontosabb, mint ahogy elsőre látszódhat. Sok fontos esetben ugyanaz a legerősebb próba működik alternatívák egész sorára, így ez egy egyenletesen legerősebb próba ezen alternatívákra. A következő részekben néhány ilyen speciális esetet tanulmányozunk ezek közül.

Hipotézisvizsgálat az exponenciális modellben

Tegyük fel, hogy X X 1 X 2 X n egy véletlen minta az exponenciális eloszlásból b skálaparaméterrel. A mintaváltozók reprezentálhatnak valamilyen típusú eszközök mintájára vonatkozó élettartamokat. A következő egyszerű hipotézist tesztelnénk: b b 0 versus b b 1 , ahol b 0 0 és b 1 0 különböző megadott értékek.

Idézzük fel, hogy a változók összege elégséges statisztika b -re:

Y i 1 n X i

Idézzük fel azt is, hogy Y gamma eloszlású n alak- és b skálaparaméterrel. α 0 1 esetén γ n b α -val jelöljük ezen eloszlás α rendű kvantilisét.

Mutassuk meg, hogy a likelihood hányados statisztika

L b 1 b 0 n 1 b 1 1 b 0 Y

Mutassuk meg, hogy a következő próbák a legerősebbek α szinten:

  1. Tegyük fel, hogy b 1 b 0 . Elutasítjuk b b 0 versus b b 1 -t akkor és csak akkor, ha Y γ n b 0 1 α .
  2. Tegyük fel, hogy b 1 b 0 . Elutasítjuk b b 0 -t versus b b 1 akkor és csak akkor, ha Y γ n b 0 α .

Jegyezzük meg, hogy a 6. feladatban szereplő próbák nem függnek b 1 értékétől. Ez a tény, kiegészítve az erőfüggvény monotonitásával, felhasználható arra, hogy megmutassuk, hogy a próba egyenletesen legerősebb a szokásos egyoldali próbák közül.

Mutassuk meg, hogy

  1. a 6(a) feladatban szereplő próba egyenletesen legerősebb a b b 0 versus b b 0 hipotézisre!
  2. a 6(b) feladatban szereplő próba egyenletesen legerősebb a b b 0 versus b b 0 hipotézisre!

Hipotézisvizsgálat a Bernoulli modellben

Tegyük fel, hogy X X 1 X 2 X n egy n elemű véletlen minta a Bernoulli eloszlásból p sikerparaméterrel. A minta reprezentálhatja egy érme n feldobásának eredményét, ahol p a fej valószínűsége. A p p 0 versus p p 1 egyszerű hipotézist kívánjuk tesztelni, ahol p 0 0 1 és p 1 0 1 különböző megadott értékek. A pénzfeldobásos modellben tudjuk, hogy a fej valószínűsége vagy p 0 vagy p 1 , de nem tudjuk, melyik.

Idézzük fel, hogy a sikerek száma elégséges statisztika p -re:

Y i 1 n X i

Idézzük fel azt is, hogy Y binomiális eloszlású n és p paraméterekkel. α 0 1 esetén b n p α -val jelöljük az eloszlás α rendű kvantilisét, bár mivel az eloszlás diszkrét, csak bizonyos α értékek lehetségesek.

Mutassuk meg, hogy a likelihood hányados statisztika

L 1 p 0 1 p 1 n p 0 1 p 1 p 1 1 p 0 Y

Mutassuk meg, hogy a következő próbák a legerősebb próbák α szinten:

  1. Tegyük fel, hogy p 1 p 0 . Elutasítjuk p p 0 versus p p 1 -t akkor és csak akkor, ha Y b n p 0 1 α .
  2. Tegyük fel, hogy p 1 p 0 . Elutasítjuk p p 0 versus p p 1 -t akkor és csak akkor, ha Y b n p 0 α .

Figyeljük meg, hogy a 9. feladatban szereplő próbák nem függnek p 1 értékétől! Ez a tény, kiegészítve az erőfüggvény monotonitásával, felhasználható arra, hogy megmutassuk, hogy a próba egyenletesen legerősebb a szokásos egyoldali próbák közül.

Mutassuk meg, hogy

  1. a 9(a) feladatban szereplő próba az egyenletesen legerősebb a p p 0 versus p p 0 hipotézisre!
  2. a 9(b) feladatban szereplő próba az egyenletesen legerősebb a p p 0 versus p p 0 hipotézisre!

Egyenletesen legerősebb próbák

Az egyoldali próbák, amiket a normál modellből származtattunk - μ -re σ ismert, μ -re σ ismeretlen és σ -ra μ ismeretlen - mind egyenletesen legerősebbek. Másrészt a kétoldali próbák egyike sem egyenletesen legerősebb.

Egy nemparaméteres példa

Tegyük fel, hogy X X 1 X 2 X n egy véletlen minta, vagy a Poisson eloszlásból 1 paraméterrel vagy a geometriai eloszlásból -en 12 paraméterrel. Így a következő hipotézist szeretnénk tesztelni:

X  sűrűségfüggvénye   f 0 x 1 1 x ,  x X  sűrűségfüggvénye   f 1 x 1 2 x 1 ,  x

Mutassuk meg, hogy a likelihood hányados statisztika

L 2 n n 2 Y U  , ahol   Y i 1 n X i  és   U i 1 n X i

Mutassuk meg, hogy a legerősebb próbák a következő alakúak d konstans esetén: Elutasítjuk -t akkor és csak akkor, ha 2 Y U d

Általánosított likelihood hányados

A likelihood hányados statisztika általánosítható összetett hipotézisekre. Tegyük fel ismét, hogy az X adatváltozó f θ sűrűségfüggvénye a θ paramétertől függ, ami Θ paramétertérbeli értékeket vesz fel. Tekintsük a θ Θ 0 versus θ Θ 0 hipotézist, ahol Θ 0 Θ . Definiáljuk

L x f θ x θ Θ 0 f θ x θ Θ

Az L függvény a likelihood hányados függvény és L X a likelihood hányados statisztika. Az előző okok miatt L x kis értékei bizonyítékként szolgálnak az alternatív hipotézis mellett.