]>
Szokás szerint a kiindulási pontunk egy véletlen kísérlet, az alapjául szolgáló mintatérrel és egy valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető valószínűségi változó, ami halmazbeli értékeket vesz fel. Általánosságban elég bonyolult struktúrájú lehet. Például ha a kísérlet objektum mintavételezése egy populációból, és különböző mérőszámokat jegyzünk fel, akkor
ahol az -edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor függetlenek és azonos eloszlásúak. Ebben az esetben egy elemű véletlen mintánk van a közös eloszlásból.
Ezen alfejezet célja, hogy definiálja és tárgyalja a statisztikai hipotézisvizsgálat alapfogalmait. Együttesen ezeket az alapfogalmakat Neyman-Pearson keretrendszernek hívjuk, Jerzy Neyman és Egon Pearson tiszteletére, akik először formalizálták ezeket a fogalmakat.
Egy statisztikai hipotézis egy állítás az adatváltozó eloszlásáról. Megegyezően, egy statisztikai hipotézis meghatározza lehetséges eloszlásainak egy halmazát (nevezetesen az eloszlásoknak azt a halmazát, amire az állítás igaz). A hipotézisvizsgálat célja, hogy meglássuk, van-e elegendő statisztikai bizonyíték egy feltételezett nullhipotézis elutasítására egy gyanított ellenhipotézis kedvéért. A nullhipotézist rendszerint -lal, míg az ellenhipotézist -gyel jelöljük. Egy hipotézist, ami egy eloszlását határozza meg, egyszerű hipotézisnek hívunk; egy olyat, ami több mint egy eloszlást határoz meg -re, összetett hipotézisnek hívunk.
Egy hipotézis vizsgálata egy statisztikai döntés; a következtetés vagy a nullhipotézis elutasítása egy alternatíva kedvéért, vagy a nullhipotézis elfogadása. A döntés, amit hoznunk kell, természetesen az adatvektoron alapul. Így először az mintatér egy részhalmazát fogjuk megtalálni, és elutasítjuk a -t akkor és csak akkor, ha . Az halmazt elutasítási tartománynak vagy kritikus tartománynak hívjuk. Figyeljük meg az aszimmetriát a nullhipotézis és az alternatív hipotézis között. Ennek az aszimmetriának az az oka, hogy feltételezzük a nullhipotézist egy bizonyos értelemben, és ezután megnézzük, hogy az tartalmaz-e elégséges bizonyítékot arra, hogy ezt a feltételezést megváltoztassuk az alternatíva kedvéért.
A kritikus tartományt gyakran egy statisztika segítségével definiáljuk, amit próbafüggvénynek hívunk. Szokás szerint egy statisztika használata lehetővé teszi az adatcsökkentést, amikor a statisztika dimenziója sokkal kisebb, mint az adatvektor dimenziója.
A végső döntés lehet helyes vagy lehet hibás. Kétféle hiba van attól függően, hogy ténylegesen melyik hipotézis igaz:
Hasonlóan, kétféleképpen hozhatunk helyes döntést: elutasíthatjuk a nullhipotézist, mikor hamis, vagy elfogadhatjuk a nullhipotézist, mikor igaz. A lehetőségeket a következő táblázatban foglaljuk össze:
Állapot\Döntés | Elfogad | Elutasít |
---|---|---|
igaz | Helyes | Elsőfajú hiba |
hamis | Másodfajú hiba | Helyes |
Ha igaz (azaz eloszlását határozza meg), akkor az elsőfajú hiba valószínűsége erre az eloszlásra. Ha összetett, akkor az különböző eloszlásainak egy választékát határozza meg, és így az elsőfajú hibák valószínűségeinek egy halmaza létezik. Az elsőfajú hibák valószínűségeinek a maximuma a próba szignifikancia szintje vagy a kritikus tartomány mérete, amit -val jelölünk. Rendszerint az elutasítási tartományt úgy konstruáljuk, hogy a szignifikancia szint valamilyen előírt, kis érték (tipikusan 0,1, 0,05, 0,01) legyen.
Ha igaz (azaz eloszlását határozza meg), akkor a másodfajú hiba valószínűsége erre az eloszlásra. Ismét, ha összetett, akkor az különböző eloszlásainak egy választékát határozza meg, és így a másodfajú hibák valószínűségeinek egy halmaza létezik. Általában kompromisszum van az elsőfajú és a másodfajú hibák valószínűségei közt. Ha csökkentjük az elsőfajú hiba valószínűségét azáltal, hogy az elutasítási tartományt kisebbé tesszük, szükségszerűen növeljük a másodfajú hiba valószínűségét, mivel az elfogadási tartomány nagyobb lesz.
Ha igaz (azaz eloszlását határozza meg), akkor a elutasításának (és így a helyes döntés meghozatalának) a valószínűsége, a próba ereje az eloszlásra.
Tegyük fel, hogy van két próbánk, amiknek az illetve elutasítási tartományok felenek meg, mindkettő szignifikancia szintje . A próba, amihez az tartomány tartozik egyenletesen erősebb, mint az a próba, amihez az tartomány tartozik, ha
Természetesen ebben az esetben az első próbát kedveljük jobban. Gyakran viszont a két próba nem rendezhető egyenletesen, az egyik próba erősebb lesz a által meghatározott bizonyos eloszlásokra, míg a másik próba erősebb lesz a által meghatározott más eloszlásokra. Végül, ha egy próba szignifikancia szintje , és egyenletesen erősebb, mint minden más próba szignifikancia szinttel, akkor ezt a próbát szintű egyenletesen legerősebb próbának hívjuk. Világos, hogy ez a próba a legjobb, amit készíthetünk.
A legtöbb esetben van egy általános eljárásunk, ami lehetővé teszi próbák (azaz elutasítási tartományok) konstruálását tetszőleges adott szignifikancia szint esetén. Tipikusan csökken (részhalmaz értelemben), ahogy csökken. Ebben a környezetben az adatváltozó -értéke, amit -szel jelölünk, definíció szerint a legkisebb , amelyre ; azaz a legkisebb szignifikancia szint, amelyre -t visszautasítjuk adott esetén. Ha ismerjük -et, akkor ez lehetővé teszi vizsgálatát bármely szignifikancia szintre az adott adatokra: Ha , akkor visszautasítjuk -t szignifikancia szinten; ha , akkor elfogadjuk -t szignifikancia szinten. Megjegyezzük, hogy egy statisztika.
A hipotézisvizsgálat nagyon általános fogalom, de egy fontos speciális eset, amikor az adatváltozó eloszlása egy paramétertől függ, ami paramétertérbeli értékeket vesz fel. A paraméter lehet vektorértékű, azaz és valamilyen -ra. A hipotézis általánosságban a következő alakú:
ahol a paramétertér előírt részhalmaza. Ilyen feltételek mellet a hiba elkövetésének vagy a helyes döntésnek a valószínűsége valódi értékétől függ. Ha az elutasítási tartomány, akkor az erőfüggvény a következő:
Mutassuk meg, hogy
Mutassuk meg, hogy
Tegyük fel, hogy van két próbánk, amik az illetve az elutasítási tartománynak felelnek meg, mindkettő szignifikancia szintje . Az visszautasítási tartománnyal rendelkező próba egyenletesen erősebb, mint az visszautasítási tartománnyal rendelkező, ha
Az ismeretlen, valós paraméterre vonatkozó próbák legtöbbje a következő három speciális eset valamelyikének felel meg:
ahol egy előre megadott érték. Az első eset a kétoldali próba; a második eset a bal oldali próba; és a harmadik eset a jobb oldali próba (a feltételezett alternatíva után). Lehetnek még egyéb ismeretlen paraméterek -n kívül (ezek a zavaró paraméterek).
A paraméterre vonatkozó hipotézisvizsgálatok és konfidencia halmazok közt szoros kapcsolat áll fenn.
Tegyük fel, hogy egy szintű konfidencia halmaz -ra. Mutassuk meg, hogy a versus hipotézisre az alábbi próba szignifikancia szintje :
illetve -t elfogadjuk szignifikancia szinten, akkor és csak akkor, ha a megfelelő szintű konfidencia halmazba esik.
Speciálisan mutassuk meg, hogy ez a megfeleltetés fennáll a valós paraméter intervallum becslése és egyszerű próbája esetén! Az alábbi esetekben a konfidencia intervallum szintű és a próba szignifikancia szintű:
Idézzük fel, hogy egy ismeretlen paraméterre vonatkozó konfidencia halmazt gyakran egy pivot változó segítségével konstruálunk meg, azaz egy valószínűségi változó segítségével, ami az adatvektortól és a paramétertől függ, de amely eloszlása nem függ -tól. Ebben az esetben egy természetes próbafüggvény .