]>
Tegyük fel, hogy egy véletlen minta a normális eloszlásból, átlaggal és szórással. Ebben a fejezetben konfidencia halmazokat fogunk készíteni -re és -ra. Ezek a halmazbecslések legfontosabb speciális esetei közé tartoznak. Egy kapcsolódó alfejezet a témáról a Hipotézisvizsgálat a normál modellben, ami a Hipotézisvizsgálat fejezetben található.
Szokás szerint, a konfidencia halmaz konstruálását megfelelő pivot változó megkeresésével kezdjük. Első lépésként standardizáljuk az eredményváltozónkat, hogy egy alap pivot vektort képezzünk, amelyből a többi pivot változót elkészíthetjük. Így minden esetén legyen
Mutassuk meg, hogy egy elemű véletlen minta a standard normális eloszlásból, és így egy pivot vektor -ra!
Emlékezzünk vissza, hogy az adatvektorunk mintaátlaga:
Mutassuk meg, hogy normális eloszlású átlaggal és szórásnégyzettel! Így a megfelelő standardizált változó standard normális eloszlású és pivot változó -ra:
Mutassuk meg, hogy a 2. feladatban szereplő pivot változó felírható az 1. feladatban szereplő alap pivot változók segítségével a következőképpen:
Szokás szerint jelöljük -vel a standard normális sűrűségfüggvényt és -vel a standard normális eloszlásfüggvényt. esetén jelölje a standard normális eloszlás -ed rendű kvantilisét. Azaz . kiválasztott értékeire -t megkaphatjuk a -eloszlás táblázatának utolsó sorából, a standard normális eloszlás táblázatából, a kvantilis appletből vagy a legtöbb statisztikai programcsomagból.
Lássuk be a következő tulajdonságokat! Használjuk az analízis inverz függvény tételét a (d) részhez:
Használjuk a 2. feladatban szereplő pivot változót, hogy megmutassuk, tetszőleges és tetszőleges esetén szintű konfidencia halmaz -ra:
Mutassuk meg, hogy az 5. feladatban szereplő konfidencia halmaz egy kúp
a
paramétertérben
csúccsal és
,
meredekségű határoló egyenesekkel,
ahogy a lenti ábrán látható! (Megjegyezzük, hogy mindkét meredekség lehet negatív, vagy mindkettő pozitív.)
Megjegyezzük, hogy a tény, hogy a konfidencia halmaz nem korlátos, nem meglepő, mivel egy valós értékű pivot változót használtunk két valós paraméter becslésére. Viszont, ha
ismert, a konfidencia halmaz egy korlátos konfidencia intervallum lesz
-re.
Geometriailag a konfidencia intervallum ebben az esetben az ismert
magasságban húzott vízszintes egyenesből a konfidencia kúp
által kimetszett szakasz lesz.
Az a feltételezés, hogy
ismert, rendszerint (de nem mindig) mesterséges. A 35. feladat példát ad olyan feltételekre, amelyek mellett a feltételezés elfogadható lehet. Elméletben kaphatunk konfidencia halmazt
-ra,
feltéve, hogy
ismert; ezek a halmazok az ismert
értéknél húzott függőleges egyenesből a konfidencia kúp
által kimetszett szakaszok/félegyenesek lesznek. Viszont az a feltételezés, hogy
ismert, majdnem mindig megalapozatlan, továbbá a
-ra
vonatkozó konfidencia halmazok általában nem lennének korlátosak.
Tanulmányozzuk a konfidencia kúp nagyságát
! Az egyik módszer, hogy megvizsgáljuk a
-nál
lévő keresztszakasz
hosszát.
Természetesen, ha
ismert, akkor
egyszerűen a konfidencia intervallum hossza
-re.
Mutassuk meg, hogy . Jegyezzük meg, hogy determinisztikus! Mutassuk meg, hogy
A 7. feladat ismét azt mutatja, hogy kompromisszum van a konfidencia szint és a konfidencia halmaz mérete közt. Ha és rögzített, akkor csökkenthetjük -et, és így javíthatjuk a becslésünket, de csak a becslés konfidencia szintjének csökkentése árán. Fordítva, növelhetjük a becslésünk konfidencia szintjét, de csak a halmaz méretének növelése árán. -t tekintve, az szintű kétoldali konfidencia halmazok közül a legjobb (és a mindig használt) az egyenlő-farkú halmaz:
Ha ismert, akkor ez a halmaz az egyenlő-farkú konfidencia intervallumot adja -re. Figyeljük meg, hogy ez az intervallum szimmetrikus az mintaátlagra!
Vizsgáljuk az 5. feladatot először a , majd a feltétel mellett! Mutassuk meg, hogy a következők szintű konfidencia halmazok -ra:
Ha ismert, az (a) rész szintű alsó konfidencia korlátot ad -re, és a (b) rész szintű felső konfidencia korlátot ad -re.
Használjuk az átlag becslés kísérletet az eljárás megismerésére! Válasszunk normál eloszlást és normál pivotot! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Ahogy fut a szimuláció, figyeljük meg, hogy a konfidencia intervallum akkor és csak akkor tartalmazza az átlagot, ha a pivot változó értéke a kvantilesek közt van! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
Tegyük fel most, hogy ismert. Jelölje a távolságot az mintaátlag és valamelyik konfidencia határ közt. Azaz
ahol a standard kétoldali intervallumra és az alsó vagy felső konfidencia intervallumra. Jegyezzük meg, hogy determinisztikus, és a standard kétoldali intervallum hossza . A számot néha hibahatárnak hívjuk. Sok esetben a kísérlet megtervezésének első lépése a mintanagyság meghatározása, ami becsléséhez szükséges adott hibahatárral és adott konfidencia szinttel.
Mutassuk meg, hogy a szükséges mintanagyság becsléséhez konfidencia szinttel és hibahatárral
Figyeljük meg, hogy egyenesen arányos -tel és -tel és fordítottan arányos -tel! Ez utóbbi tényből következik, hogy a hibahatár csökkentésekor a csökkenő hozadék elve érvényesül. Például, ha a hibahatárt a felére szeretnénk csökkenteni, akkor a mintanagyságot a négyszeresére kell növelnünk.
Emlékezzünk vissza, hogy a
valószínűségi változót néha a minta szórásnégyzet speciális változataként használjuk, mikor az eloszlás várható értéke ismert. Másrészt a minta szórásnégyzet szokásos változata (korrigált tapasztalati szórásnégyzet)
Emlékeztetünk arra, hogy a normál minták egyik legfontosabb speciális tulajdonsága az, hogy az mintaátlag és az korrigált tapasztalati szórásnégyzet függetlenek. Most legyen
Mutassuk meg, hogy felírható az 1. feladatban szereplő alap pivot változók segítségével a lenti módon! Mutassuk meg, hogy ez a változó pivot változó -ra és khi-négyzet eloszlású szabadságfokkal!
Mutassuk meg, hogy . Emiatt szintén felírható az 1. feladatban szereplő alap pivot változók segítségével, és így pivot változó -ra és -ra. Végül mutassuk meg, hogy ez a változó khi-négyzet eloszlású szabadságfokkal!
Jelölje illetve a szabadságfokú khi-négyzet eloszlás sűrűségfüggvényét illetve eloszlásfüggvényét. Továbbá -re jelölje az eloszlás -ed rendű kvantilisét, azaz definíció szerint . és kiválasztott értékei esetén a -t megkaphatjuk a khi-négyzet eloszlás táblázatából, a kvantilis appletből vagy a legtöbb statisztikai programcsomagból.
Mutassuk meg a következő tulajdonságokat! A (c) részhez használjuk az analízis inverz függvény tételét!
Használjuk az pivot változót, hogy megmutassuk, hogy tetszőleges és tetszőleges esetén szintű konfidencia halmaz -ra:
Mutassuk meg, hogy a konfidencia halmaz határoló görbéit a következő egyenlőség adja meg, ahol a megfelelő khi-négyzet kvantilis! Így a konfidencia halmaz két hiperbola pozitív ága közti régió. Mindkét hiperbola centruma , ahogy az ábrán látható.
Ahogy eddig, a konfidencia halmaz nem korlátos, ismét nem meglepő módon, mivel két valós paramétert becsültünk egy valós pivot változó segítségével. Viszont, ha ismert, a konfidencia halmaz egy korlátos konfidencia intervallum -re. Geometriailag ez az intervallum megfelel a függőleges metsző szakasznak -nél. Ha a konfidencia korlátok négyzetgyökét vesszük, akkor konfidencia intervallumot kapunk -ra. Az a feltételezés, hogy ismert, majdnem mindig mesterséges; a konfidencia halmaz, amit a pivot változó felhasználásával képzünk, konfidencia intervallumhoz vezet -ra anélkül, hogy feltételeznénk, hogy ismert. Elméletben kaphatunk konfidencia halmazt -re, ha feltételezzük, hogy ismert; ez a halmaz megfelel a vízszintes metsző szakasznak -nál. Jegyezzük meg, hogy általánosságban ez a halmaz nem egy intervallum, hanem két diszjunkt intervallum uniója. Tehát az előző szakaszban leírt konstrukció jobb ilyen esetben.
Tekintsük a 14. feladatban szereplő konfidencia halmazt illetve feltétel mellett! Mutassuk meg, hogy a következők szintű konfidencia halmazok -ra:
Ha ismert, akkor az (a) rész szintű alsó konfidencia korlátot ad -re, és a (b) rész szintű felső konfidencia korlátot ad -re.
A 14. feladatban szereplő konfidencia halmazok közül, rögzített konfidencia szint esetén, jobban kedveljük azt, aminek kisebb a nagysága
, mivel ez a halmaz adja a legtöbb információt a paraméterekről. Ebben az esetben nem világos, hogyan mérjük a halmaz nagyságát. Amikor
ismert, természetesen lehetne a mérték a konfidencia intervallum hossza. Jegyezzük meg azonban, hogy ez a hossz véletlen. Ami fontosabb, a hossznak, mint
függvényének, a minimalizálása kiszámítását tekintve nehéz. Mindezen okok miatt, általában az egyenlő-farkú konfidencia halmazt használjuk, ami
-nek felel meg:
Próbáljuk meg minimalizálni a 14. feladatban szereplő intervallum hosszát, mint függvényét, rögzített esetén!
Használjuk a pivot változót, hogy megmutassuk, hogy tetszőleges és tetszőleges esetén szintű konfidencia halmaz -ra:
Ez a konfidencia halmaz a konstrukcióból adódóan nem ad információt -ről, de -re korlátos konfidencia intervallumot biztosít. Ha a konfidencia korlátok négyzetgyökét vesszük, akkor -ra kapunk konfidencia intervallumot.
Tekintsük a 18. feladatban szereplő konfidencia halmazt illetve feltétel mellett! Mutassuk meg, hogy a következők szintű konfidencia halmazok -ra:
Az (a) rész szintű alsó konfidencia korlátot ad -re, és a (b) rész szintű felső konfidencia korlátot ad -re
A 18. feladatban szereplő konfidencia halmazok közül, rögzített konfidencia szint esetén, jobban kedveljük azt, aminek kisebb a nagysága
, mivel ez a halmaz adja a legtöbb információt a paraméterekről. Ebben az esetben természetesen mérhetjük a konfidencia halmaz nagyságát a konfidencia intervallum hosszával (a függőleges metsző szakasz). Megjegyezzük, hogy ez a hossz véletlen. Ami fontosabb, a hossznak, mint
függvényének, a minimalizálása kiszámítását tekintve nehéz. Így rendszerint az egyenlő-farkú konfidencia halmazt használjuk, ami
-nek felel meg:
Próbáljuk meg minimalizálni a 18. feladatban szereplő intervallum hosszát, mint függvényét, rögzített esetén!
Használjuk a szórásnégyzet becslés kísérletet az eljárás megismerésére! Válasszuk a normál eloszlást! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Ahogy fut a szimuláció, figyeljük meg, hogy a konfidencia intervallum akkor és csak akkor tartalmazza a szórást, ha a pivot változó értéke a kvantilesek közt van! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
Az utolsó alap konfidencia halmaz esetén megváltoztatjuk a standard normál pivotot, amit először vizsgáltunk, úgy, hogy az eloszlás szórását kicseréljük a minta szórására. Ez -re vonatkozó konfidencia intervallumhoz vezet, anélkül a feltételezés nélkül, hogy ismert. Szerencsére ez működik a statisztikák néhány speciális tulajdonsága miatt, amikor a minta eloszlása normális. Legyen
Mutassuk meg, hogy
Az előző feladatot felhasználva, mutassuk meg, hogy felírható az 1. feladatban szereplő alap pivot változók segítségével, és ezen változó eloszlása Student-féle eloszlás szabadságfokkal! Így ez a változó pivot változó -ra és egyedül -re is.
esetén jelölje illetve a szabadságfokú -eloszlás sűrűségfüggvényét illetve eloszlásfüggvényét. Továbbá esetén jelölje az eloszlás -ed rendű kvantilisét, azaz . és rögzített értékei esetén értékei megkaphatók a eloszlás táblázatból vagy a kvantilis appletből.
Mutassuk meg a következő tulajdonságokat! A (d) rész az analízis inverz függvény tételéből következik.
Mutassuk meg, hogy tetszőleges és esetén szintű konfidencia intervallum -ra:
Ez a konfidencia halmaz a konstrukcióból adódóan nem ad információt -ról, de -re korlátos konfidencia intervallumot biztosít. A konfidencia halmaz világosan mérhető -lel, a vízszintes metsző szakasz hosszával, vagy ekvivalensen a -re vonatkozó konfidencia intervallum hosszával.
Mutassuk meg, hogy . Megjegyezzük, hogy véletlen. Mutassuk meg, hogy
A 26. feladat ismét rámutat arra, hogy a konfidencia szint és a konfidencia halmaz mérete közt kompromisszum van. Ha és rögzítettek, csak a becslés konfidencia szintjének csökkentése árán csökkenthetjük -et és javíthatjuk a becslésünket. Fordítva, csak a halmaz méretének növelése árán növelhetjük a becslésünk konfidencia szintjét. -t tekintve, az szintű kétoldali konfidencia halmazok közül a legjobb (és a mindig használt) az egyenlő-farkú halmaz:
Ez a halmaz egyenlő-farkú konfidencia intervallumot ad -re. Megjegyezzük, hogy ez az intervallum szimmetrikus az mintaátlagra, de az intervallum hossza ismét véletlen.
Tekintsük a 25. feladatban szereplő konfidencia halmazt illetve esetén! Mutassuk meg, hogy a következők szintű konfidencia halmazok -ra:
Az (a) rész szintű alsó konfidencia korlátot ad -re, és a (b) rész szintű felső konfidencia korlátot ad -re.
Használjuk az átlag becslés kísérletet az eljárás megismerésére! Válasszunk normál eloszlást és Student pivotot! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Ahogy fut a szimuláció, figyeljük meg, hogy a konfidencia intervallum akkor és csak akkor tartalmazza az átlagot, ha a pivot változó értéke a kvantilesek közt van! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
A következőkben a fent konstruált konfidencia halmazok felhasználásával metszeteket képzünk, hogy korlátos konfidencia halmazokat nyerjünk -ra. Azt a tényt fogjuk felhasználni, hogy az mintaátlag és az korrigált tapasztalati szórásnégyzet függetlenek, ami a normál minták egyik legfontosabb speciális tulajdonsága. Szükségünk lesz még az 1. feladatra a Bevezetésből, ami Bonferroni egyenlőtlenségen alapul. A következő feladatokban tegyük fel, hogy és .
Mutassuk meg, hogy az alábbi halmazok konzervatív szintű konfidencia halmazok -ra:
Használjuk a függetlenséget, hogy megmutassuk, hogy egy szintű konfidencia halmaz -ra! Ez egy ék alakú konfidencia halmaz, ahogy a lenti ábrán is látható.
Érdekes megjegyezni, hogy a 29(b) feladatban szereplő konfidencia halmaz egy szorzathalmaz, mint a paramétertér egy részhalmaza, de nem szorzathalmaz, mint a mintatér részhalmaza. Ellenkezőleg, a 30. feladatban szereplő konfidencia halmaz nem szorzathalmaz, mint a paramétertér egy részhalmaza, de szorzathalmaz, mint a mintatér egy részhalmaza.
Az alapfeltevésünk az volt, hogy a megalapozó minta eloszlása normális. Természetesen valós statisztikai problémák esetén valószínűtlen, hogy sokat tudunk a minta eloszlásáról, még arról sem, hogy vajon normális-e. Amikor egy statisztikai eljárás meglehetősen jól működik, még ha a megalapozó feltevések nem is teljesülnek, az eljárást robusztusnak hívjuk. Ebben az alfejezetben és becslési eljárásainak robusztusságát fogjuk megvizsgálni.
Tegyük fel, hogy a tényleges eloszlás nem normális. Amikor az mintanagyság elég nagy, a mintaátlag eloszlása közelítően normális lesz a centrális határeloszlás tétel szerint. Így a -re vonatkozó intervallumbecslésünk közelítően érvényes lehet.
Használjuk az átlag becslés kísérletet az eljárás megismerésére! Válasszunk gamma eloszlást és Student pivotot! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
Az átlag becslés kísérletben ismételjük meg az előző gyakorlatot egyenletes eloszlással!
Hogy milyen nagy szükséges ahhoz, hogy a -re vonatkozó intervallum becslési eljárás jól működjön, természetesen függ az alap eloszlástól; minél inkább eltér ez az eloszlás a normálistól, annál nagyobb szükséges. Szerencsére a normálishoz tartó konvergencia gyors a centrális határeloszlás tétel szerint, és így, ahogy a gyakorlatban megfigyelhettük, viszonylag kis mintanagysággal (30 vagy több) is célt érhettünk a legtöbb esetben.
Általánosságban, a -ra vonatkozó intervallum becslési eljárások nem olyan robusztusak, mint a -re vonatkozók.
A szórásnégyzet becslés kísérletben válasszuk a gamma eloszlást! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
A szórásnégyzet becslés kísérletben válasszuk az egyenletes eloszlást! Használjunk különböző paraméterértékeket, konfidencia szintet, mintanagyságot és intervallumtípust! Minden beállítás esetén futtassuk ezerszer a kísérletet, tízes frissítési gyakorisággal! Figyeljük meg a konfidencia intervallumok méretét és elhelyezkedését, valamint hogy a sikeres intervallumok aránya hogyan közelíti az elméleti konfidencia szintet!
A következő feladatokban a kétoldali konfidencia intervallumok esetén konstruáljunk egyenlő-farkú intervallumot, hacsak a feladat mást nem mond!
Egy bizonyos gépalkatrész hossza 10 centiméter elméletileg, de a gyártási folyamat tökéletlensége miatt a tényleges hossz normális eloszlású várható értékkel és szórásnégyzettel. A szórásnégyzet a folyamat sajátosságai miatt nem változik az idők során. Történeti adatokból tudjuk, hogy . Másrészt különböző gyártási paraméterek módosításával befolyásolható, és így elég gyakran változhat valamilyen ismeretlen értékre. Egy 100 elemű mintára az átlag 10,2.
Tegyük fel, hogy egy zacskó csipsz tömege (grammban) normális eloszlású valószínűségi változó várható értékkel és szórással, mindkettő ismeretlen. Egy 75 elemű mintára az átlag 250 és a szórás 10.
Egy telemarketing cégnél a telefonos kérelem hossza (másodpercekben) normális eloszlású valószínűségi változó várható értékkel és szórással, mindkettő ismeretlen. Egy 50 hívást tartalmazó minta alapján az átlag 300 és a szórás 60.
Egy bizonyos farmon az őszibarack tömege szüret idején (unciában) normális eloszlású valószínűségi változó, melynek szórása 0,5. Hány darab őszibarackot kell mintavételezni, hogy az átlagtömeget hibahatárral és 95%-os konfidencia szinten meg tudjuk becsülni?
Egy bizonyos típusú építési munkán az órabér normális eloszlású valószínűségi változó 1,25 dollár szórással és ismeretlen várható értékkel. Hány munkást kell mintavételezni, hogy 95%-os alsó konfidencia korlátot konstruálhassunk -re 0,25 dollár hibahatárral?
A Michelson adatok esetén tegyük fel, hogy a mért fénysebesség normális eloszlású várható értékkel és szórással, mindkettő ismeretlen.
valódiértéke ebben az intervallumban?
A Cavendish adatok esetén tegyük fel, hogy a mért sűrűségadatok (a Föld sűrűsége) normális eloszlásúak várható értékkel és szórással, mindkettő ismeretlen.
valódiértéke ebben az intervallumban?
A Short adatok esetén tegyük fel, hogy a Nap mért parallaxis adatai normális eloszlásúak várható értékkel és szórással, mindkettő ismeretlen.
valódiértéke ebben az intervallumban?
Tegyük fel, hogy az írisz egy adott fajtájának (Setosa, Verginica vagy Versicolor) sziromhossza normális eloszlású. Használjuk a Fisher írisz adatokat, hogy 90%-os kétoldali konfidencia intervallumot konstruáljunk a következő paraméterekre: