Bevezetés

Szokás szerint a kiindulási pontunk egy véletlen kísérlet, az alapjául szolgáló mintatérrel és egy

valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető

X

valószínűségi változó, ami

S

halmazbeli értékeket vesz fel. Általánosságban

X

elég bonyolult struktúrájú lehet. Például ha a kísérlet

n

objektum mintavételezése egy populációból, és különböző mérőszámokat jegyzünk fel, akkor

ahol

X i

i

-edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor

X 1 X 2 X n

függetlenek és azonos eloszlásúak. Ebben az esetben egy

n

elemű véletlen mintánk van a közös eloszlásból.

Ezen alfejezet célja, hogy definiálja és tárgyalja a statisztikai hipotézisvizsgálat alapfogalmait. Együttesen ezeket az alapfogalmakat Neyman-Pearson keretrendszernek hívjuk, Jerzy Neyman és Egon Pearson tiszteletére, akik először formalizálták ezeket a fogalmakat.

Általános hipotézisvizsgálatok

Egy statisztikai hipotézis egy állítás az

X

adatváltozó eloszlásáról. Megegyezően, egy statisztikai hipotézis meghatározza

X

lehetséges eloszlásainak egy halmazát (nevezetesen az eloszlásoknak azt a halmazát, amire az állítás igaz). A hipotézisvizsgálat célja, hogy meglássuk, van-e elegendő statisztikai bizonyíték egy feltételezett nullhipotézis elutasítására egy gyanított ellenhipotézis kedvéért. A nullhipotézist rendszerint

-lal, míg az ellenhipotézist

-gyel jelöljük. Egy hipotézist, ami

X

egy eloszlását határozza meg, egyszerű hipotézisnek hívunk; egy olyat, ami több mint egy eloszlást határoz meg

X

-re, összetett hipotézisnek hívunk.

Egy hipotézis vizsgálata egy statisztikai döntés; a következtetés vagy a nullhipotézis elutasítása egy alternatíva kedvéért, vagy a nullhipotézis elfogadása. A döntés, amit hoznunk kell, természetesen az

X

adatvektoron alapul. Így először az

S

mintatér egy

R

részhalmazát fogjuk megtalálni, és elutasítjuk a

-t akkor és csak akkor, ha

X R

. Az

R

halmazt elutasítási tartománynak vagy kritikus tartománynak hívjuk. Figyeljük meg az aszimmetriát a nullhipotézis és az alternatív hipotézis között. Ennek az aszimmetriának az az oka, hogy feltételezzük a nullhipotézist egy bizonyos értelemben, és ezután megnézzük, hogy az

X

tartalmaz-e elégséges bizonyítékot arra, hogy ezt a feltételezést megváltoztassuk az alternatíva kedvéért.

A kritikus tartományt gyakran egy

W X

statisztika segítségével definiáljuk, amit próbafüggvénynek hívunk. Szokás szerint egy statisztika használata lehetővé teszi az adatcsökkentést, amikor a statisztika dimenziója sokkal kisebb, mint az adatvektor dimenziója.

Hibák

A végső döntés lehet helyes vagy lehet hibás. Kétféle hiba van attól függően, hogy ténylegesen melyik hipotézis igaz:

Hasonlóan, kétféleképpen hozhatunk helyes döntést: elutasíthatjuk a nullhipotézist, mikor hamis, vagy elfogadhatjuk a nullhipotézist, mikor igaz. A lehetőségeket a következő táblázatban foglaljuk össze:

Hipotézis vizsgálata
Állapot\Döntés	Elfogad	Elutasít
igaz	Helyes	Elsőfajú hiba
hamis	Másodfajú hiba	Helyes

igaz (azaz

X

eloszlását

határozza meg), akkor

X R

az elsőfajú hiba valószínűsége erre az eloszlásra. Ha

összetett, akkor

X

különböző eloszlásainak egy választékát határozza meg, és így az elsőfajú hibák valószínűségeinek egy halmaza létezik. Az elsőfajú hibák valószínűségeinek a maximuma a próba szignifikancia szintje vagy a kritikus tartomány mérete, amit

α

-val jelölünk. Rendszerint az elutasítási tartományt úgy konstruáljuk, hogy a szignifikancia szint valamilyen előírt, kis érték (tipikusan 0,1, 0,05, 0,01) legyen.

igaz (azaz

X

eloszlását

határozza meg), akkor

X R

a másodfajú hiba valószínűsége erre az eloszlásra. Ismét, ha

összetett, akkor

X

különböző eloszlásainak egy választékát határozza meg, és így a másodfajú hibák valószínűségeinek egy halmaza létezik. Általában kompromisszum van az elsőfajú és a másodfajú hibák valószínűségei közt. Ha csökkentjük az elsőfajú hiba valószínűségét azáltal, hogy az

R

elutasítási tartományt kisebbé tesszük, szükségszerűen növeljük a másodfajú hiba valószínűségét, mivel az

S R

elfogadási tartomány nagyobb lesz.

A próba ereje

igaz (azaz

X

eloszlását

határozza meg), akkor

X R

elutasításának (és így a helyes döntés meghozatalának) a valószínűsége, a próba ereje az eloszlásra.

Tegyük fel, hogy van két próbánk, amiknek az

R 1

illetve

R 2

elutasítási tartományok felenek meg, mindkettő szignifikancia szintje

α

. A próba, amihez az

R 1

tartomány tartozik egyenletesen erősebb, mint az a próba, amihez az

R 2

tartomány tartozik, ha

Természetesen ebben az esetben az első próbát kedveljük jobban. Gyakran viszont a két próba nem rendezhető egyenletesen, az egyik próba erősebb lesz a

által meghatározott bizonyos eloszlásokra, míg a másik próba erősebb lesz a

által meghatározott más eloszlásokra. Végül, ha egy próba szignifikancia szintje

α

, és egyenletesen erősebb, mint minden más próba

α

szignifikancia szinttel, akkor ezt a próbát

α

szintű egyenletesen legerősebb próbának hívjuk. Világos, hogy ez a próba a legjobb, amit készíthetünk.

P

-érték

A legtöbb esetben van egy általános eljárásunk, ami lehetővé teszi próbák (azaz

R α

elutasítási tartományok) konstruálását tetszőleges adott

α 01

szignifikancia szint esetén. Tipikusan

R α

csökken (részhalmaz értelemben), ahogy

α

csökken. Ebben a környezetben az

X

adatváltozó

P

-értéke, amit

P X

-szel jelölünk, definíció szerint a legkisebb

α

, amelyre

X R α

; azaz a legkisebb szignifikancia szint, amelyre

-t visszautasítjuk adott

X

esetén. Ha ismerjük

P X

-et, akkor ez lehetővé teszi

vizsgálatát bármely szignifikancia szintre az adott adatokra: Ha

P X α

, akkor visszautasítjuk

-t

α

szignifikancia szinten; ha

P X α

, akkor elfogadjuk

-t

α

szignifikancia szinten. Megjegyezzük, hogy

P X

egy statisztika.

Egy paraméteres próbák

A hipotézisvizsgálat nagyon általános fogalom, de egy fontos speciális eset, amikor az

X

adatváltozó eloszlása egy

θ

paramétertől függ, ami

Θ

paramétertérbeli értékeket vesz fel. A paraméter lehet vektorértékű, azaz

θ θ 1 θ 2 θ k

és

Θ k

valamilyen

k

-ra. A hipotézis általánosságban a következő alakú:

ahol

Θ 0

Θ

paramétertér előírt részhalmaza. Ilyen feltételek mellet a hiba elkövetésének vagy a helyes döntésnek a valószínűsége

θ

valódi értékétől függ. Ha

R

az elutasítási tartomány, akkor az erőfüggvény a következő:

Mutassuk meg, hogy

$Q θ$ az elsőfajú hiba valószínűsége, ha $θ Θ 0$
$Q θ : θ Θ 0$ a próba szignifikancia szintje.

Mutassuk meg, hogy

$1 Q θ$ a másodfajú hiba valószínűsége, ha $θ Θ 0$ .
$Q θ$ a próba ereje, ha $θ Θ 0$ .

Tegyük fel, hogy van két próbánk, amik az

R 1

illetve az

R 2

elutasítási tartománynak felelnek meg, mindkettő szignifikancia szintje

α

. Az

R 1

visszautasítási tartománnyal rendelkező próba egyenletesen erősebb, mint az

R 2

visszautasítási tartománnyal rendelkező, ha

Az ismeretlen, valós

θ

paraméterre vonatkozó próbák legtöbbje a következő három speciális eset valamelyikének felel meg:

ahol

θ 0

egy előre megadott érték. Az első eset a kétoldali próba; a második eset a bal oldali próba; és a harmadik eset a jobb oldali próba (a feltételezett alternatíva után). Lehetnek még egyéb ismeretlen paraméterek

θ

-n kívül (ezek a zavaró paraméterek).

A hipotézisvizsgálatok és a konfidencia halmazok közti összefüggés

θ

paraméterre vonatkozó hipotézisvizsgálatok és konfidencia halmazok közt szoros kapcsolat áll fenn.

Tegyük fel, hogy $C X$ egy $1 α$ szintű konfidencia halmaz $θ$ -ra. Mutassuk meg, hogy a $θ θ 0$ versus $θ θ 0$ hipotézisre az alábbi próba szignifikancia szintje $α$ :

-t visszautasítjuk akkor és csak akkor, ha θ 0 C X

illetve

-t elfogadjuk

α

szignifikancia szinten, akkor és csak akkor, ha

θ 0

a megfelelő

1 α

szintű konfidencia halmazba esik.

Speciálisan mutassuk meg, hogy ez a megfeleltetés fennáll a $θ$ valós paraméter intervallum becslése és $θ$ egyszerű próbája esetén! Az alábbi esetekben a konfidencia intervallum $1 α$ szintű és a próba $α$ szignifikancia szintű:

Tegyük fel, hogy $L X U X$ egy kétoldali konfidencia intervallum $θ$ -ra. Elutasítjuk a $θ θ 0$ versus $θ θ 0$ hipotézist akkor és csak akkor, ha $θ 0 L X$ vagy $θ 0 U X$
Tegyük fel, hogy $L X$ egy alsó konfidencia korlát $θ$ -ra. Elutasítjuk a $θ θ 0$ versus $θ θ 0$ hipotézist akkor és csak akkor, ha $θ 0 L X$
Tegyük fel, hogy $U X$ egy felső konfidencia korlát $θ$ -ra. Elutasítjuk a $θ θ 0$ versus $θ θ 0$ hipotézist akkor és csak akkor, ha $θ 0 U X$

Pivot változók és próbafüggvények

Idézzük fel, hogy egy ismeretlen

θ

paraméterre vonatkozó konfidencia halmazt gyakran egy pivot változó segítségével konstruálunk meg, azaz egy

W X θ

valószínűségi változó segítségével, ami az

X

adatvektortól és a

θ

paramétertől függ, de amely eloszlása nem függ

θ

-tól. Ebben az esetben egy természetes próbafüggvény

W X θ 0

1. Bevezetés

Az alap statisztikai modell

Általános hipotézisvizsgálatok

Hibák

A próba ereje

P -érték

Egy paraméteres próbák

A hipotézisvizsgálatok és a konfidencia halmazok közti összefüggés

Pivot változók és próbafüggvények

$P$ -érték