]> Bevezetés
  1. Virtual Laboratories
  2. 8. Hipotézisvizsgálat
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7

1. Bevezetés

Az alap statisztikai modell

Szokás szerint a kiindulási pontunk egy véletlen kísérlet, az alapjául szolgáló mintatérrel és egy valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető X valószínűségi változó, ami S halmazbeli értékeket vesz fel. Általánosságban X elég bonyolult struktúrájú lehet. Például ha a kísérlet n objektum mintavételezése egy populációból, és különböző mérőszámokat jegyzünk fel, akkor

X X 1 X 2 X n

ahol X i az i -edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor X 1 X 2 X n függetlenek és azonos eloszlásúak. Ebben az esetben egy n elemű véletlen mintánk van a közös eloszlásból.

Ezen alfejezet célja, hogy definiálja és tárgyalja a statisztikai hipotézisvizsgálat alapfogalmait. Együttesen ezeket az alapfogalmakat Neyman-Pearson keretrendszernek hívjuk, Jerzy Neyman és Egon Pearson tiszteletére, akik először formalizálták ezeket a fogalmakat.

Általános hipotézisvizsgálatok

Egy statisztikai hipotézis egy állítás az X adatváltozó eloszlásáról. Megegyezően, egy statisztikai hipotézis meghatározza X lehetséges eloszlásainak egy halmazát (nevezetesen az eloszlásoknak azt a halmazát, amire az állítás igaz). A hipotézisvizsgálat célja, hogy meglássuk, van-e elegendő statisztikai bizonyíték egy feltételezett nullhipotézis elutasítására egy gyanított ellenhipotézis kedvéért. A nullhipotézist rendszerint -lal, míg az ellenhipotézist -gyel jelöljük. Egy hipotézist, ami X egy eloszlását határozza meg, egyszerű hipotézisnek hívunk; egy olyat, ami több mint egy eloszlást határoz meg X -re, összetett hipotézisnek hívunk.

Egy hipotézis vizsgálata egy statisztikai döntés; a következtetés vagy a nullhipotézis elutasítása egy alternatíva kedvéért, vagy a nullhipotézis elfogadása. A döntés, amit hoznunk kell, természetesen az X adatvektoron alapul. Így először az S mintatér egy R részhalmazát fogjuk megtalálni, és elutasítjuk a -t akkor és csak akkor, ha X R . Az R halmazt elutasítási tartománynak vagy kritikus tartománynak hívjuk. Figyeljük meg az aszimmetriát a nullhipotézis és az alternatív hipotézis között. Ennek az aszimmetriának az az oka, hogy feltételezzük a nullhipotézist egy bizonyos értelemben, és ezután megnézzük, hogy az X tartalmaz-e elégséges bizonyítékot arra, hogy ezt a feltételezést megváltoztassuk az alternatíva kedvéért.

A kritikus tartományt gyakran egy W X statisztika segítségével definiáljuk, amit próbafüggvénynek hívunk. Szokás szerint egy statisztika használata lehetővé teszi az adatcsökkentést, amikor a statisztika dimenziója sokkal kisebb, mint az adatvektor dimenziója.

Hibák

A végső döntés lehet helyes vagy lehet hibás. Kétféle hiba van attól függően, hogy ténylegesen melyik hipotézis igaz:

  1. elsőfajú hiba: elutasítjuk a nullhipotézist, mikor igaz.
  2. másodfajú hiba: elfogadjuk a nullhipotézist, mikor hamis.

Hasonlóan, kétféleképpen hozhatunk helyes döntést: elutasíthatjuk a nullhipotézist, mikor hamis, vagy elfogadhatjuk a nullhipotézist, mikor igaz. A lehetőségeket a következő táblázatban foglaljuk össze:

Hipotézis vizsgálata
Állapot\Döntés Elfogad Elutasít
igaz Helyes Elsőfajú hiba
hamis Másodfajú hiba Helyes

Ha igaz (azaz X eloszlását határozza meg), akkor X R az elsőfajú hiba valószínűsége erre az eloszlásra. Ha összetett, akkor az X különböző eloszlásainak egy választékát határozza meg, és így az elsőfajú hibák valószínűségeinek egy halmaza létezik. Az elsőfajú hibák valószínűségeinek a maximuma a próba szignifikancia szintje vagy a kritikus tartomány mérete, amit α -val jelölünk. Rendszerint az elutasítási tartományt úgy konstruáljuk, hogy a szignifikancia szint valamilyen előírt, kis érték (tipikusan 0,1, 0,05, 0,01) legyen.

Ha igaz (azaz X eloszlását határozza meg), akkor X R a másodfajú hiba valószínűsége erre az eloszlásra. Ismét, ha összetett, akkor az X különböző eloszlásainak egy választékát határozza meg, és így a másodfajú hibák valószínűségeinek egy halmaza létezik. Általában kompromisszum van az elsőfajú és a másodfajú hibák valószínűségei közt. Ha csökkentjük az elsőfajú hiba valószínűségét azáltal, hogy az R elutasítási tartományt kisebbé tesszük, szükségszerűen növeljük a másodfajú hiba valószínűségét, mivel az S R elfogadási tartomány nagyobb lesz.

A próba ereje

Ha igaz (azaz X eloszlását határozza meg), akkor X R a elutasításának (és így a helyes döntés meghozatalának) a valószínűsége, a próba ereje az eloszlásra.

Tegyük fel, hogy van két próbánk, amiknek az R 1 illetve R 2 elutasítási tartományok felenek meg, mindkettő szignifikancia szintje α . A próba, amihez az R 1 tartomány tartozik egyenletesen erősebb, mint az a próba, amihez az R 2 tartomány tartozik, ha

X R 1 X R 2 X  tetszőleges    eloszlására, amit    határoz meg  

Természetesen ebben az esetben az első próbát kedveljük jobban. Gyakran viszont a két próba nem rendezhető egyenletesen, az egyik próba erősebb lesz a által meghatározott bizonyos eloszlásokra, míg a másik próba erősebb lesz a által meghatározott más eloszlásokra. Végül, ha egy próba szignifikancia szintje α , és egyenletesen erősebb, mint minden más próba α szignifikancia szinttel, akkor ezt a próbát α szintű egyenletesen legerősebb próbának hívjuk. Világos, hogy ez a próba a legjobb, amit készíthetünk.

P -érték

A legtöbb esetben van egy általános eljárásunk, ami lehetővé teszi próbák (azaz R α elutasítási tartományok) konstruálását tetszőleges adott α 0 1 szignifikancia szint esetén. Tipikusan R α csökken (részhalmaz értelemben), ahogy α csökken. Ebben a környezetben az X adatváltozó P -értéke, amit P X -szel jelölünk, definíció szerint a legkisebb α , amelyre X R α ; azaz a legkisebb szignifikancia szint, amelyre -t visszautasítjuk adott X esetén. Ha ismerjük P X -et, akkor ez lehetővé teszi vizsgálatát bármely szignifikancia szintre az adott adatokra: Ha P X α , akkor visszautasítjuk -t α szignifikancia szinten; ha P X α , akkor elfogadjuk -t α szignifikancia szinten. Megjegyezzük, hogy P X egy statisztika.

Egy paraméteres próbák

A hipotézisvizsgálat nagyon általános fogalom, de egy fontos speciális eset, amikor az X adatváltozó eloszlása egy θ paramétertől függ, ami Θ paramétertérbeli értékeket vesz fel. A paraméter lehet vektorértékű, azaz θ θ 1 θ 2 θ k és Θ k valamilyen k -ra. A hipotézis általánosságban a következő alakú:

θ Θ 0  versus   θ Θ 0

ahol Θ 0 a Θ paramétertér előírt részhalmaza. Ilyen feltételek mellet a hiba elkövetésének vagy a helyes döntésnek a valószínűsége θ valódi értékétől függ. Ha R az elutasítási tartomány, akkor az erőfüggvény a következő:

Q θ θ X R ,  θ Θ

Mutassuk meg, hogy

  1. Q θ az elsőfajú hiba valószínűsége, ha θ Θ 0
  2. Q θ : θ Θ 0 a próba szignifikancia szintje.

Mutassuk meg, hogy

  1. 1 Q θ a másodfajú hiba valószínűsége, ha θ Θ 0 .
  2. Q θ a próba ereje, ha θ Θ 0 .

Tegyük fel, hogy van két próbánk, amik az R 1 illetve az R 2 elutasítási tartománynak felelnek meg, mindkettő szignifikancia szintje α . Az R 1 visszautasítási tartománnyal rendelkező próba egyenletesen erősebb, mint az R 2 visszautasítási tartománnyal rendelkező, ha

Q 1 θ Q 2 θ ,  θ Θ 0

Az ismeretlen, valós θ paraméterre vonatkozó próbák legtöbbje a következő három speciális eset valamelyikének felel meg:

  1. θ θ 0 versus θ θ 0
  2. θ θ 0 versus θ θ 0
  3. θ θ 0 versus θ θ 0

ahol θ 0 egy előre megadott érték. Az első eset a kétoldali próba; a második eset a bal oldali próba; és a harmadik eset a jobb oldali próba (a feltételezett alternatíva után). Lehetnek még egyéb ismeretlen paraméterek θ -n kívül (ezek a zavaró paraméterek).

A hipotézisvizsgálatok és a konfidencia halmazok közti összefüggés

A θ paraméterre vonatkozó hipotézisvizsgálatok és konfidencia halmazok közt szoros kapcsolat áll fenn.

Tegyük fel, hogy C X egy 1 α szintű konfidencia halmaz θ -ra. Mutassuk meg, hogy a θ θ 0 versus θ θ 0 hipotézisre az alábbi próba szignifikancia szintje α :

-t  visszautasítjuk  akkor és csak akkor, ha  θ 0 C X

illetve -t elfogadjuk α szignifikancia szinten, akkor és csak akkor, ha θ 0 a megfelelő 1 α szintű konfidencia halmazba esik.

Speciálisan mutassuk meg, hogy ez a megfeleltetés fennáll a θ valós paraméter intervallum becslése és θ egyszerű próbája esetén! Az alábbi esetekben a konfidencia intervallum 1 α szintű és a próba α szignifikancia szintű:

  1. Tegyük fel, hogy L X U X egy kétoldali konfidencia intervallum θ -ra. Elutasítjuk a θ θ 0 versus θ θ 0 hipotézist akkor és csak akkor, ha θ 0 L X vagy θ 0 U X
  2. Tegyük fel, hogy L X egy alsó konfidencia korlát θ -ra. Elutasítjuk a θ θ 0 versus θ θ 0 hipotézist akkor és csak akkor, ha θ 0 L X
  3. Tegyük fel, hogy U X egy felső konfidencia korlát θ -ra. Elutasítjuk a θ θ 0 versus θ θ 0 hipotézist akkor és csak akkor, ha θ 0 U X

Pivot változók és próbafüggvények

Idézzük fel, hogy egy ismeretlen θ paraméterre vonatkozó konfidencia halmazt gyakran egy pivot változó segítségével konstruálunk meg, azaz egy W X θ valószínűségi változó segítségével, ami az X adatvektortól és a θ paramétertől függ, de amely eloszlása nem függ θ -tól. Ebben az esetben egy természetes próbafüggvény W X θ 0 .