]>
Szokás szerint, kiindulási pontunk egy véletlen kísérlet egy mintatérrel és egy valószínűségi mértékkel. Az alap statisztikai modellben van egy megfigyelhető valószínűségi változó, ami halmazbeli értékeket vesz fel. Általánosságban összetett struktúrájú lehet. Például, ha a kísérlet objektum mintavételezése egy populációból és különböző mérőszámokat jegyzünk fel, akkor
ahol az -edik objektum mérőszámainak vektora. A legfontosabb speciális eset, mikor függetlenek és azonos eloszlásúak. Ebben az esetben egy elemű véletlen mintánk van a közös eloszlásból.
Tegyük fel azt is, hogy eloszlása egy paramétertől függ, ami paramétertérbeli értékeket vesz fel. A paraméter szintén lehet vektor értékű, ebben az esetben valamilyen esetén és .
A konfidencia halmaz a paramétertér részhalmaza, ami csak az adatváltozótól függ, és nem ismeretlen paraméterektől. Így bizonyos értelemben, a konfidencia halmaz egy halmaz-értékű statisztika. A konfidencia halmaz egy becslése, abban az értelemben, hogy azt reméljük, hogy nagy valószínűséggel. Speciálisan, a konfidencia szint a legkisebb valószínűség, amire :
Rendszerint -ra valamilyen előírt konfidencia szintre próbálunk meg konfidencia halmazt konstruálni, ahol . Tipikus konfidencia szint pl. 0,9, 0,95, 0,99. Néha a legtöbb, amit tehetünk, hogy olyan konfidencia halmazt konstruálunk, melyre a konfidencia szint legalább , ezt hívjuk konzervatív konfidencia halmaznak -ra.
Megjegyezzük, hogy amikor elvégezzük a kísérletet és megfigyeljük az adatot, a számított konfidencia halmaz . A paraméter valódi értéke vagy benne van ebben a halmazban vagy nincs, és rendszerint ezt nem is tudjuk. Viszont a nagy számok törvénye szerint, ha újra és újra megismételnénk a kísérletet, a halmazok aránya, melyek tartalmazzák -t, konvergálna -hoz. Ez a konfidencia kifejezés pontos jelentése.
Ezután jegyezzük meg, hogy a konfidencia halmaznak, mint
becslésének a minősége két tényezőtől függ: a konfidencia szinttől és a halmaz méretétől
. Egy jó becslésnek kicsi a mérete
(és így szűk határokat ad
-ra)
és nagy a konfidencia szintje. Mindemellett, adott
esetén,
rendszerint kompromisszum van a konfidencia szint és a méret között - a konfidencia szint növelését csak a méret növelése árán tehetjük meg, és a halmaz méretét csak a konfidencia szint csökkentés árán csökkenthetjük. Az, hogy hogyan mérjük a konfidencia halmaz méretét
, függ a paramétertér dimenziójától és a konfidencia halmaz jellegétől. Továbbá a halmaz mérete rendszerint véletlen, bár néhány speciális esetben lehet determinisztikus.
Tegyük fel, hogy egy szintű konfidencia halmaz -ra esetén. Mutassuk meg, hogy ha , akkor egy konzervatív, szintű konfidencia halmaz -ra! Útmutatás: Használjuk a Bonferroni egyenlőtlenséget!
Sok esetben egy valós paraméter becslése érdekel minket, ami az intervallum paramétertérben vesz fel értékeket. Ebben az összefüggésben a konfidencia halmaz gyakran a következő alakú:
ahol és statisztikák. Ebben az esetben konfidencia intervallum -ra. Ha és mindketten véletlenszerűek, akkor a konfidencia intervallumot kétoldalinak hívjuk. Abban a speciális esetben, amikor és véletlen, -et alsó konfidencia korlátjának hívjuk és az intervallumot felső konfidencia intervallumának hívjuk. Abban az esetben, ha és véletlenszerű, -et felső konfidencia korlátjának hívjuk és az intervallumot alsó konfidencia intervallumának hívjuk.
Tegyük fel, hogy egy szintű alsó konfidencia korlát -ra, és hogy egy szintű felső konfidencia korlát -ra. Mutassuk meg, hogy ha , akkor egy szintű konzervatív konfidencia intervallum -ra! Útmutatás: Használjuk az 1. feladatot!
Azt hihetjük, hogy nagyon bonyolult lehet konfidencia halmaz konstruálása a paraméterre. Azonban sok fontos speciális esetben bizonyos valószínűségi változók (pivot változók) alapján könnyen készíthetők konfidencia halmazok.
Tegyük fel, hogy egy függvény -ból a halmazba. A valószínűségi változó pivot változó -ra, ha eloszlása nem függ -tól. Speciálisan, konstans -ban minden esetén. Ha ismerjük a pivot változó eloszlását, akkor adott esetén megpróbálhatunk találni olyan -t (ami nem függ -tól), hogy
Ebből következik, hogy egy szintű konfidencia halmaz a paraméterre:
Tegyük fel, hogy a pivot változónk, , valós értékű, és az egyszerűség kedvéért tegyük fel, hogy folytonos eloszlású. esetén jelölje a pivot változó -ed rendű kvantilisét. A pivot változó valódi jelentése szerint nem függ -tól.
Mutassuk meg, hogy bármely -re, szintű konfidencia halmaz -ra:
A 3. feladatban szereplő konfidencia halmaz összhangban van az bal farokkal és a jobb farokkal a pivot változó eloszlásának szempontjából. Az az eset, amikor az egyenlő nagyságú farkak esete, a leggyakoribb eset.
Mutassuk meg, hogy a 3. feladatban szereplő konfidencia halmaz csökkenő -ban és így növekvő -ban (a részhalmaz relációt tekintve) rögzített esetén!
Tovább részletezve tegyük fel, hogy valós paraméterek vektora, és valamelyik koordinátáját akarjuk becsülni; a többi koordinátát néha zavaró paraméternek hívjuk ebben a környezetben. Gyakran az a helyzet, hogy a valós értékű pivot változó a szigorúan csökkenő függvénye minden -re és egyéb koordinátáinak minden értékére. Ezen feltételek esetén a konfidencia halmazt megkaphatjuk, ha invertáljuk a pivot változót -re vonatkozóan.
Mutassuk meg, hogy a fenti feltételek esetén a 3. feladatban szereplő konfidencia halmaz -ra felírható a következő alakban, ahol -t a paramétervektorból kapjuk elhagyásával:
Szavakkal leírva a formula jelentését, az inverz transzformációt alkalmaztuk, hogy megkapjuk a -re vonatkozó korlátokat, amik az adatváltozótól, többi koordinátájától (a zavaró paraméterektől) és a pivot változó kvantiliseitől függnek. Ha a többi paraméter ismert, akkor ezek a korlátok statisztikák, és megkonstruáltunk egy konfidencia intervallumot -re.
A 3. feladatban szereplő konfidencia halmaz esetén természetesen szeretnénk olyan -t választani, amely minimalizálja a halmaz méretét valamilyen értelemben. Azonban ez gyakran nehéz probléma. Az egyenlő nagyságú farkak esete, ami -nek felel meg, a leggyakrabban használt eset, és néha (de nem mindig) az optimális választás.
A pivot változók közel sem egyediek, az a kihívás, hogy olyan pivot mennyiséget találjunk, aminek ismert az eloszlása, és ami szűk határokat ad a paraméterre.
Tegyük fel, hogy egy pivot változó -ra. Mutassuk meg, hogy ha olyan függvény, ami értékkészletén definiált, és nem von be ismeretlen paramétereket, akkor szintén egy pivot változó -ra!
Eloszlások hely- és skálaparaméteres családjai esetén könnyen találhatunk pivot változót. Tegyük fel, hogy egy valós értékű folytonos eloszlású valószínűségi változó, melynek sűrűségfüggvénye , és nincs ismeretlen paramétere. Legyen , ahol és paraméterek. Emlékezzünk vissza, hogy sűrűségfüggvénye:
és a kapcsolódó eloszláscsaládot a eloszlásával összekapcsolt hely- és skálaparaméteres családnak hívjuk; a helyparaméter és a skálaparaméter. Általánosságban feltehetjük, hogy ezek a paraméterek ismeretlenek.
Most tegyük fel, hogy egy elemű véletlen minta eloszlásából; ez a megfigyelhető eredményvektorunk. Minden esetén legyen
Mutassuk meg, hogy egy elemű véletlen minta eloszlásából!
Speciálisan jegyezzük meg, hogy egy pivot változó -ra, mivel , , és függvénye, de eloszlása nem függ -től és -tól. Így bármely függvénye szintén pivot változó lesz -ra (ha a függvényben nem szerepelnek ezek a paraméterek). Természetesen ezen pivot változók némelyike hasznosabb és becslésében, mint mások. A következő feladatokban két gyakori és fontos pivot változót ismerünk meg.
Jelölje illetve illetve mintaátlagát. Mutassuk meg, hogy pivot változó -ra, mivel
.Jelölje az pivot változó kvantilis függvényét. Mutassuk meg, hogy tetszőleges esetén szintű konfidencia halmaz -ra:
Mutassuk meg, hogy a 9. feladatban szereplő konfidencia halmaz egy kúp
a
paramétertérben, aminek csúcsa
és a határoló egyenesek meredeksége
és
,
ahogy a lenti ábrán látható. (Megjegyezzük, hogy mindkét meredekség lehet negatív, vagy mindkettő pozitív.)
A tény, hogy a konfidencia halmaz nem korlátos, természetesen nem jó, de talán nem is meglepő; két valós paramétert becsültünk egy valós értékű pivot változó alapján. Viszont, ha
ismert, a konfidencia halmaz egy konfidencia intervallumot határoz meg
-re.
Geometriailag a konfidencia intervallum ebben az esetben az ismert
magasságban húzott vízszintes egyenesből a konfidencia kúp
által kimetszett szakasz lesz.
A 9. feladatban szereplő konfidencia halmaz esetén vizsgáljuk először a , majd a esetet! Mutassuk meg, hogy szintű konfidencia halmazok -ra:
Ha ismert, akkor a 11(a) feladat szintű alsó konfidencia korlátot ad -re, és a 11(b) feladat szintű felső konfidencia korlátot ad -re.
Jelölje illetve illetve korrigált tapasztalati szórását. Mutassuk meg, hogy egy pivot változó -ra, és pivot változó -ra, mivel
Jelölje az kvantilis függvényét. A pivot változót felhasználva mutassuk meg, hogy tetszőleges és tetszőleges esetén egy szintű konfidencia halmaz -ra:
Jegyezzük meg, hogy a konfidencia halmaz nem ad semmilyen információt -ről, mivel a 13. feladatban szereplő valószínűségi változó csak a pivot változója! A konfidencia halmazt tekinthetjük, mint egy korlátos konfidencia intervallumot -ra.
A 13. feladatban szereplő konfidencia halmaz esetén legyen illetve . Mutassuk meg, hogy szintű konfidencia halmazok -ra:
Az (a) részben szereplő halmaz szintú alsó konfidencia korlátot ad -ra, és a (b) részben szereplő halmaz szintű felső konfidencia korlátot ad -ra.
Vehetjük a két pivot változóhoz tartozó konfidencia halmazok metszetét, hogy konzervatív, korlátos konfidencia halmazt kapjunk.
Tegyük fel, hogy és . Használjuk az 1. feladatot, hogy megmutassuk, hogy egy konzervatív szintű konfidencia halmaz -ra!
A legfontosabb hely- és skálaparaméteres eloszláscsalád a normális eloszlás családja. A becslés a normál modellben problémát a következő fejezetben tekintjük át. Ezen alfejezet hátralévő részében egy másik fontos skálaparaméteres családot vizsgálunk.
Tegyük fel, hogy egy elemű véletlen minta az exponenciális eloszlásból skálaparaméterrel. Legyen
Mutassuk meg, hogy khi-négyzet eloszlású szabadságfokkal, és így pivot változó -ra!
Jegyezzük meg, hogy a 16. feladatban szereplő változó a 8. feladatban szereplő változó többszöröse ( esetén). Így jelölje illetve a szabadságfokú khi-négyzet eloszlás sűrűség- illetve eloszlásfüggvényét. Továbbá esetén jelölje az eloszlás -ed rendű kvantilisét. Azaz . és kiválasztott értékei esetén a értékei megkaphatók a khi-négyzet eloszlás táblázatából, a kvantilis appletből vagy a legtöbb statisztikai szoftvercsomagból.
Mutassuk meg, hogy
Mutassuk meg, hogy tetszőleges és tetszőleges esetén szintű konfidencia intervallum -ra:
Mutassuk meg, hogy
A 18. feladatban szereplő kétoldali konfidencia intervallumok közül természtesen jobban kedveljük azt, aminek a legkisebb a hossza, mert ez az intervallum adja a legtöbb információt a paraméterről. Viszont a hossz, mint függvénye, minimalizálása kiszámítását tekintve nehéz. A kétoldali konfidencia intervallum, amit általában használunk, az egyenlő nagyságú farkaknak megfelelő intervallum, amit esetén kapunk:
Próbáljuk megtalálni azt a -t, ami minimalizálja a 18. feladatban szereplő intervallum hosszát!