Bevezetés

Szokás szerint, kiindulási pontunk egy véletlen kísérlet egy mintatérrel és egy

valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető

X

valószínűségi változó, ami

S

halmazbeli értékeket vesz fel. Általánosságban

X

összetett struktúrájú lehet. Például, ha a kísérlet

n

objektum mintavételezése egy populációból és különböző mérőszámokat jegyzünk fel, akkor

ahol

X i

i

-edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor

X 1 X 2 X n

függetlenek és azonos eloszlásúak. Ebben az esetben egy

n

elemű véletlen mintánk van a közös eloszlásból.

Tegyük fel azt is, hogy

X

eloszlása egy

θ

paramétertől függ, ami

Θ

paramétertérbeli értékeket vesz fel. A

θ

paraméter szintén lehet vektor értékű, ebben az esetben

Θ k

valamilyen

k

esetén és

θ θ 1 θ 2 θ k

Konfidencia halmazok

A konfidencia halmaz a

Θ

paramétertér

C X

részhalmaza, ami csak az

X

adatváltozótól függ, és nem ismeretlen paraméterektől. Így bizonyos értelemben, a konfidencia halmaz egy halmaz-értékű statisztika. A konfidencia halmaz

θ

egy becslése, abban az értelemben, hogy azt reméljük, hogy

θ C X

nagy valószínűséggel. Speciálisan, a konfidencia szint a legkisebb valószínűség, amire

θ C X

Rendszerint

θ

-ra valamilyen előírt

1 α

konfidencia szintre próbálunk meg konfidencia halmazt konstruálni, ahol

0 α 1

. Tipikus konfidencia szint pl. 0,9, 0,95, 0,99. Néha a legtöbb, amit tehetünk, hogy olyan konfidencia halmazt konstruálunk, melyre a konfidencia szint legalább

1 α

, ezt hívjuk konzervatív

1 α

konfidencia halmaznak

θ

-ra.

Megjegyezzük, hogy amikor elvégezzük a kísérletet és megfigyeljük az

x

adatot, a számított konfidencia halmaz

C x

. A

θ

paraméter valódi értéke vagy benne van ebben a halmazban vagy nincs, és rendszerint ezt nem is tudjuk. Viszont a nagy számok törvénye szerint, ha újra és újra megismételnénk a kísérletet, a halmazok aránya, melyek tartalmazzák

θ

-t, konvergálna

θ θ C X 1 α

-hoz. Ez a konfidencia kifejezés pontos jelentése.

Ezután jegyezzük meg, hogy a konfidencia halmaznak, mint

θ

becslésének a minősége két tényezőtől függ: a konfidencia szinttől és a halmaz méretétől. Egy jó becslésnek kicsi a mérete (és így szűk határokat ad

θ

-ra) és nagy a konfidencia szintje. Mindemellett, adott

X

esetén, rendszerint kompromisszum van a konfidencia szint és a méret között - a konfidencia szint növelését csak a méret növelése árán tehetjük meg, és a halmaz méretét csak a konfidencia szint csökkentés árán csökkenthetjük. Az, hogy hogyan mérjük a konfidencia halmaz méretét, függ a paramétertér dimenziójától és a konfidencia halmaz jellegétől. Továbbá a halmaz mérete rendszerint véletlen, bár néhány speciális esetben lehet determinisztikus.

Tegyük fel, hogy $C i X$ egy $1 α i$ szintű konfidencia halmaz $θ$ -ra $i 12 k$ esetén. Mutassuk meg, hogy ha $α α 1 α 2 α k 1$ , akkor $C 1 X C 2 X C k X$ egy konzervatív, $1 α$ szintű konfidencia halmaz $θ$ -ra! Útmutatás: Használjuk a Bonferroni egyenlőtlenséget!

Sok esetben egy

λ λ θ

valós paraméter becslése érdekel minket, ami az

a b

intervallum paramétertérben vesz fel értékeket. Ebben az összefüggésben a konfidencia halmaz gyakran a következő alakú:

ahol

L X

és

U X

statisztikák. Ebben az esetben

L X U X

konfidencia intervallum

λ

-ra. Ha

L X

és

U X

mindketten véletlenszerűek, akkor a konfidencia intervallumot kétoldalinak hívjuk. Abban a speciális esetben, amikor

U X b

és

L X

véletlen,

L X

-et

λ

alsó konfidencia korlátjának hívjuk és az

L X b

intervallumot

λ

felső konfidencia intervallumának hívjuk. Abban az esetben, ha

L X a

és

U X

véletlenszerű,

U X

-et

λ

felső konfidencia korlátjának hívjuk és az

a U X

intervallumot

λ

alsó konfidencia intervallumának hívjuk.

Tegyük fel, hogy $L X$ egy $1 α$ szintű alsó konfidencia korlát $λ$ -ra, és hogy $U X$ egy $1 β$ szintű felső konfidencia korlát $λ$ -ra. Mutassuk meg, hogy ha $α β 1$ , akkor $L X U X$ egy $1 α β$ szintű konzervatív konfidencia intervallum $λ$ -ra! Útmutatás: Használjuk az 1. feladatot!

Pivot változók

Azt hihetjük, hogy nagyon bonyolult lehet konfidencia halmaz konstruálása a

θ

paraméterre. Azonban sok fontos speciális esetben bizonyos valószínűségi változók (pivot változók) alapján könnyen készíthetők konfidencia halmazok.

Tegyük fel, hogy

V

egy függvény

S Θ

-ból a

T

halmazba. A

V X θ

valószínűségi változó pivot változó

θ

-ra, ha eloszlása nem függ

θ

-tól. Speciálisan,

θ V X θ B

konstans

θ Θ

-ban minden

B T

esetén. Ha ismerjük a pivot változó eloszlását, akkor adott

α

esetén megpróbálhatunk találni olyan

B T

-t (ami nem függ

θ

-tól), hogy

Tegyük fel, hogy a pivot változónk,

V X θ

, valós értékű, és az egyszerűség kedvéért tegyük fel, hogy folytonos eloszlású.

p 01

esetén jelölje

v p

V X θ

pivot változó

p

-ed rendű kvantilisét. A pivot változó valódi jelentése szerint

v p

nem függ

θ

-tól.

Mutassuk meg, hogy bármely $p 01$ -re, $1 α$ szintű konfidencia halmaz $θ$ -ra:

θ Θ v α p α V X θ v 1 p α

A 3. feladatban szereplő konfidencia halmaz összhangban van az

1 p α

bal farokkal és a

p α

jobb farokkal a

V X λ

pivot változó eloszlásának szempontjából. Az az eset, amikor

p 1 2

az egyenlő nagyságú farkak esete, a leggyakoribb eset.

Mutassuk meg, hogy a 3. feladatban szereplő konfidencia halmaz csökkenő $α$ -ban és így növekvő $1 α$ -ban (a részhalmaz relációt tekintve) rögzített $p$ esetén!

Tovább részletezve tegyük fel, hogy

θ θ 1 θ 2 θ n

valós paraméterek vektora, és

θ

valamelyik

θ i

koordinátáját akarjuk becsülni; a többi koordinátát néha zavaró paraméternek hívjuk ebben a környezetben. Gyakran az a helyzet, hogy a valós értékű

V x θ

pivot változó a

θ i

szigorúan csökkenő függvénye minden

x S

-re és

θ

egyéb koordinátáinak minden értékére. Ezen feltételek esetén a konfidencia halmazt megkaphatjuk, ha invertáljuk a pivot változót

θ i

-re vonatkozóan.

Mutassuk meg, hogy a fenti feltételek esetén a 3. feladatban szereplő $1 α$ konfidencia halmaz $θ$ -ra felírható a következő alakban, ahol $θ i$ -t a $θ$ paramétervektorból kapjuk $θ i$ elhagyásával:

θ Θ W X θ i v 1 p α θ i W X θ i v α p α

Szavakkal leírva a formula jelentését, az inverz transzformációt alkalmaztuk, hogy megkapjuk a

θ i

-re vonatkozó korlátokat, amik az

X

adatváltozótól,

θ

többi koordinátájától (a zavaró paraméterektől) és a pivot változó kvantiliseitől függnek. Ha a többi paraméter ismert, akkor ezek a korlátok statisztikák, és megkonstruáltunk egy konfidencia intervallumot

θ i

-re.

A 3. feladatban szereplő konfidencia halmaz esetén természetesen szeretnénk olyan

p

-t választani, amely minimalizálja a halmaz méretét valamilyen értelemben. Azonban ez gyakran nehéz probléma. Az egyenlő nagyságú farkak esete, ami

p 1 2

-nek felel meg, a leggyakrabban használt eset, és néha (de nem mindig) az optimális választás.

A pivot változók közel sem egyediek, az a kihívás, hogy olyan pivot mennyiséget találjunk, aminek ismert az eloszlása, és ami szűk határokat ad a paraméterre.

Tegyük fel, hogy $V$ egy pivot változó $θ$ -ra. Mutassuk meg, hogy ha $g$ olyan függvény, ami $V$ értékkészletén definiált, és $g$ nem von be ismeretlen paramétereket, akkor $U g V$ szintén egy pivot változó $θ$ -ra!

Hely- és skálaparaméteres családok

Eloszlások hely- és skálaparaméteres családjai esetén könnyen találhatunk pivot változót. Tegyük fel, hogy

Z

egy valós értékű folytonos eloszlású valószínűségi változó, melynek sűrűségfüggvénye

g

, és nincs ismeretlen paramétere. Legyen

X μ σ Z

, ahol

μ

és

σ 0

paraméterek. Emlékezzünk vissza, hogy

X

sűrűségfüggvénye:

és a kapcsolódó eloszláscsaládot a

Z

eloszlásával összekapcsolt hely- és skálaparaméteres családnak hívjuk;

μ

a helyparaméter és

σ

a skálaparaméter. Általánosságban feltehetjük, hogy ezek a paraméterek ismeretlenek.

Most tegyük fel, hogy

X X 1 X 2 X n

egy

n

elemű véletlen minta

X

eloszlásából; ez a megfigyelhető eredményvektorunk. Minden

i

esetén legyen

Mutassuk meg, hogy $Z Z 1 Z 2 Z n$ egy $n$ elemű véletlen minta $Z$ eloszlásából!

Speciálisan jegyezzük meg, hogy

Z

egy pivot változó

μ σ

-ra, mivel

Z

X

μ

, és

σ

függvénye, de

Z

eloszlása nem függ

μ

-től és

σ

-tól. Így

Z

bármely függvénye szintén pivot változó lesz

μ σ

-ra (ha a függvényben nem szerepelnek ezek a paraméterek). Természetesen ezen pivot változók némelyike hasznosabb

μ

és

σ

becslésében, mint mások. A következő feladatokban két gyakori és fontos pivot változót ismerünk meg.

Jelölje $M X$ illetve $M Z$ $X$ illetve $Z$ mintaátlagát. Mutassuk meg, hogy $M Z$ pivot változó $μ σ$ -ra, mivel

M Z M X μ σ

Jelölje $m$ az $M Z$ pivot változó kvantilis függvényét. Mutassuk meg, hogy tetszőleges $p 01$ esetén $1 α$ szintű konfidencia halmaz $μ σ$ -ra:

Z α p X μ σ M X m 1 p α σ μ M X m α p α σ

Mutassuk meg, hogy a 9. feladatban szereplő konfidencia halmaz egy kúp a $μ σ$ paramétertérben, aminek csúcsa $M X 0$ és a határoló egyenesek meredeksége $1 m 1 p α$ és $1 m α p α$ , ahogy a lenti ábrán látható. (Megjegyezzük, hogy mindkét meredekség lehet negatív, vagy mindkettő pozitív.)

A tény, hogy a konfidencia halmaz nem korlátos, természetesen nem jó, de talán nem is meglepő; két valós paramétert becsültünk egy valós értékű pivot változó alapján. Viszont, ha

σ

ismert, a konfidencia halmaz egy konfidencia intervallumot határoz meg

μ

-re. Geometriailag a konfidencia intervallum ebben az esetben az ismert

σ

magasságban húzott vízszintes egyenesből a konfidencia kúp által kimetszett szakasz lesz.

A 9. feladatban szereplő konfidencia halmaz esetén vizsgáljuk először a $p 1$ , majd a $p 0$ esetet! Mutassuk meg, hogy $1 α$ szintű konfidencia halmazok $μ σ$ -ra:

$Z α 1 X μ σ M X m 1 α σ μ$
$Z α 0 X μ σ μ M X m α σ$

σ

ismert, akkor a 11(a) feladat

1 α

szintű alsó konfidencia korlátot ad

μ

-re, és a 11(b) feladat

1 α

szintű felső konfidencia korlátot ad

μ

-re.

Jelölje $S X$ illetve $S Z$ $X$ illetve $Z$ korrigált tapasztalati szórását. Mutassuk meg, hogy $S Z$ egy pivot változó $μ σ$ -ra, és pivot változó $σ$ -ra, mivel

S Z S X σ

Jelölje $s$ az $S Z$ kvantilis függvényét. A pivot változót felhasználva mutassuk meg, hogy tetszőleges $α 01$ és tetszőleges $p 01$ esetén egy $1 α$ szintű konfidencia halmaz $μ σ$ -ra:

V α p X μ σ S X s 1 p α σ S X s α p α

Jegyezzük meg, hogy a konfidencia halmaz nem ad semmilyen információt

μ

-ről, mivel a 13. feladatban szereplő valószínűségi változó csak a

σ

pivot változója! A konfidencia halmazt tekinthetjük, mint egy korlátos konfidencia intervallumot

σ

-ra.

A 13. feladatban szereplő konfidencia halmaz esetén legyen $p 1$ illetve $p 0$ . Mutassuk meg, hogy $1 α$ szintű konfidencia halmazok $μ σ$ -ra:

$V α 1 X μ σ S X s 1 α σ$
$V α 0 X μ σ 0 σ S X s α$

Az (a) részben szereplő halmaz

1 α

szintú alsó konfidencia korlátot ad

σ

-ra, és a (b) részben szereplő halmaz

1 α

szintű felső konfidencia korlátot ad

σ

-ra.

Vehetjük a két pivot változóhoz tartozó konfidencia halmazok metszetét, hogy konzervatív, korlátos konfidencia halmazt kapjunk.

Tegyük fel, hogy $α β p q 014$ és $α β 1$ . Használjuk az 1. feladatot, hogy megmutassuk, hogy $Z α p X V β q X$ egy konzervatív $1 α β$ szintű konfidencia halmaz $μ σ$ -ra!

A legfontosabb hely- és skálaparaméteres eloszláscsalád a normális eloszlás családja. A becslés a normál modellben problémát a következő fejezetben tekintjük át. Ezen alfejezet hátralévő részében egy másik fontos skálaparaméteres családot vizsgálunk.

Az exponenciális eloszlás

Tegyük fel, hogy

X X 1 X 2 X n

egy

n

elemű véletlen minta az exponenciális eloszlásból

σ 0

skálaparaméterrel. Legyen

Mutassuk meg, hogy $2 σ Y$ khi-négyzet eloszlású $2 n$ szabadságfokkal, és így pivot változó $σ$ -ra!

Jegyezzük meg, hogy a 16. feladatban szereplő változó a 8. feladatban szereplő változó többszöröse (

μ 0

esetén). Így jelölje

g k

illetve

G k

k

szabadságfokú khi-négyzet eloszlás sűrűség- illetve eloszlásfüggvényét. Továbbá

p 01

esetén jelölje

k p

az eloszlás

p

-ed rendű kvantilisét. Azaz

k p G k p

k

és

p

kiválasztott értékei esetén a

k p

értékei megkaphatók a khi-négyzet eloszlás táblázatából, a kvantilis appletből vagy a legtöbb statisztikai szoftvercsomagból.

Mutassuk meg, hogy

$k p 0$ , ha $p 0$
$k p$ , ha $p 1$
$p k p 1 g k k p$ (Útmutatás: használjuk az analízis inverz függvény tételét - az inverz függvény deriválási szabályát!)

Mutassuk meg, hogy tetszőleges $α 01$ és tetszőleges $p 01$ esetén $1 α$ szintű konfidencia intervallum $σ$ -ra:

2 Y 2 n 1 p α 2 Y 2 n α p α

Mutassuk meg, hogy

$2 Y 2 n 1 α$ $1 α$ szintű alsó konfidencia korlát $σ$ -ra!
$2 Y 2 n α$ $1 α$ szintű alsó konfidencia korlát $σ$ -ra!

A 18. feladatban szereplő kétoldali konfidencia intervallumok közül természtesen jobban kedveljük azt, aminek a legkisebb a hossza, mert ez az intervallum adja a legtöbb információt a

b

paraméterről. Viszont a hossz, mint

p

függvénye, minimalizálása kiszámítását tekintve nehéz. A kétoldali konfidencia intervallum, amit általában használunk, az egyenlő nagyságú farkaknak megfelelő intervallum, amit

p 1 2

esetén kapunk:

Próbáljuk megtalálni azt a $p$ -t, ami minimalizálja a 18. feladatban szereplő intervallum hosszát!

1. Bevezetés

Az alap statisztikai modell

Konfidencia halmazok

Pivot változók

Hely- és skálaparaméteres családok

Az exponenciális eloszlás