]>
Tételezzük fel, hogy van egy dichotom populációnk. Azaz egy populáció, amely csak két típusú objektumot tartalmaz, melyekre úgy hivatkozunk, hogy 1 típusú, vagy 0 típusú. Például
Jelölje -nek azt a részhalmazát, amely csak 1 típusú objektumot tartalmaz és tételezzük fel, hogy és . Amint az alap mintavételi modellben, a mintát a halmazból objektum véletlenszerű kiválasztásával nyerjük. Ebben a részben csak az objektum típusai érdekelnek minket, így jelölje a választott -edik objektum (1 vagy 0) típusát. A típusok vektora
Minket főleg az az valószínűségi változó érdekel, ami megadja a mintában szereplő 1 típusú objektumoknak a számát. Megjegyezzük, hogy egy számláló változó, és így hasonlóan az összes számláló változóhoz, felírható, mint indikátor változók összege, ebben az esetben:
Feltételezzük, hogy a mintavétel visszatevés nélküli, amely a dichotom populációknál valószerű feltevés.
Emlékeztetünk arra, mivel a mintavétel visszatevés nélküli, a rendezetlen minta egyenletes eloszlású a -ből választott méretű összes kombinációk halmaza felett. Ez a megfigyelés sűrűségfüggvényének egy egyszerű kombinatorikai származtatásához vezet.
Mutassuk meg, hogy
Ez, mint , , és paraméterű hypergeometrikus eloszlás ismeretes.
Mutassuk meg a hipergeometrikus sűrűségfüggvény következő alternatív alakját kétféle módon: kombinatorikusan mint egy labdából álló populációból választott méretű permutáció, és algebrailag, kiindulva az 1. gyakorlat eredményéből.
Emlékeztetünk arra a megállapodásra, hogy esetén. Ezzel a megállapodással a sűrűségfüggvénnyel kapcsolatos formulák az 1. gyakorlatban és a 2. gyakorlatban kifogástalanok esetére. Rendszerint ezt az egyszerűbb előírást használjuk a hipergeometrikus eloszlás értékeihez.
Legyen . Mutassuk meg, hogy
A golyó és urnakísérletben válasszuk a visszatevés nélküli mintavételt. Változtassuk a paramétereket és figyeljük meg a sűrűségfüggvény alakját. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve a gyakoriságot és figyeljük meg a relatív gyakoriság függvényének a sűrűségfüggvényhez való konvergenciáját.
A következő gyakorlatokban várható értékének és szórásnégyzetének formuláját fogjuk megadni. Az indikátorváltozók cserélhető tulajdonsága, valamint a kovariancia és a korreláció tulajdonságai játsszák a főszerepet.
Mutassuk meg, hogy minden -re.
Mutassuk meg, hogy .
Mutassuk meg, hogy minden -re.
Mutassuk meg, hogy különböző -re és -re
Jegyezzük meg a 8. gyakorlatból, hogy az az esemény, hogy az -ből az 1 típusú objektumot húzzuk ki, és az az esemény, hogy a -ből az 1 típusú objektumot húzzuk ki, negatívan korrelál, de a korreláció csak a populáció méretétől függ és nem függ az 1 típusú objektumok számától. Megemlítjük, hogy a korreláció teljes, ha . Gondolja át, hogy mit jelentenek ezek az eredmények intuitíven!
Felhasználva a 7. gyakorlat és a 8. gyakorlat eredményeit, mutassuk meg, hogy
Megjegyezzük, hogy , ha , vagy , vagy . Gondoljuk át ezeket az eredményeket.
A golyó és urnakísérletben válasszuk a visszatevés nélküli mintavételt. Változtassuk a paramétereket és figyeljük meg a várható érték/standard szórás ábrájának méretét és helyzetét. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer mindegyik 10-edik kísérlet után frissítve és figyeljük meg az empirikus momentumnak a valódi (elméleti) momentumhoz való konvergenciáját.
Tételezzük fel, hogy a mintavétel visszatevéses, annak ellenére, hogy az alkalmazásokban rendszerint ez nem valószerű.
Mutassuk meg, hogy Bernoulli kísérletnek egy sorozata paraméterrel.
Az alábbi eredmények nem következnek közvetlenül a Bernoulli kísérletek általános elméletéből, annak ellenére, hogy a korábban használt bizonyítás módosított változatát használjuk.
Mutassuk meg, hogy binomiális eloszlású és paraméterekkel:
Mutassuk meg, hogy
Megjegyezzük, hogy a paraméterek minden értékére várható értéke ugyanaz, akár visszatevéses, akár visszatevés nélküli mintavételről van szó. Másrészt szórásnégyzete faktorral kisebb, amikor a mintavétel visszatevés nélküli. Gondoljuk át ezeket az eredményeket. Az faktort néha véges populációs korrekciós faktornak nevezzük.
A golyó és urnakísérletben változtassuk a paramétereket és váltsunk a visszatevés nélküli és a visszatevéses mintavétel között. Figyeljük meg a hipergeometrikus eloszlás sűrűségfüggvényének és a binomiális eloszlás sűrűségfüggvényének az ábrái közötti különbséget! Figyeljük meg a várható érték/standard szórás grafikonjai közötti különbséget is! A paraméterek kiválasztott értékeire és a két különböző mintavételi mód (eljárás) esetére végezzük el a kísérletet 1000-szer, 10-esével frissítve.
Tételezzük fel, hogy az populációs méret nagyon nagy az mintamérethez képest. Ebben az esetben az tűnik ésszerűnek, hogy a visszatevés nélküli mintavétel ne nagyon különbözzön a visszatevéses mintavételtől és ennél fogva a hipergeometrikus eloszlás jól közelítené a binomiális eloszlást. A következő gyakorlat ezt a megfigyelést teszi pontossá. Gyakorlatilag, ez egy értékes eredmény, mivel a binomiális eloszlásnak kevesebb paramétere van. Pontosabban nekünk nem szükséges ismerni az populációs paramétert és az 1 típusú objektumok számát egyedenként, hanem csak az alábbi hányadost .
Tételezzük fel, hogy -től függ és hogy ha . Mutassuk meg, hogy fix esetén az , , és paraméterű hipergeometrikus eloszlás az és paraméterű binomiális eloszláshoz konvergál. Útmutatás: Használjuk a 2. gyakorlatban lévő reprezentációt.
Az előző gyakorlatban lévő konvergencia típusa, mint eloszlásban való konvergencia ismert.
A golyó és urnakísérletben változtassuk a paramétereket és váltsunk a visszatevés nélküli és a visszatevéses mintavétel között. Figyeljük meg a hipergeometrikus eloszlás sűrűségfüggvényének és a binomiális eloszlás sűrűségfüggvényének az ábrái közötti különbséget. Speciálisan figyeljük meg a hasonlóságot, amikor nagy és kicsi. A paraméterek kiválasztott értékeire és a két különböző mintavételi mód (eljárás) esetére végezzük el a kísérletet 1000-szer, 10-esével frissítve.
A 15. gyakorlat jelöléseit használva mutassuk meg, hogy a hipergeometrikus eloszlás várható értéke és szórásnégyzete konvergál a binomiális eloszlás várható értékéhez és szórásnégyzetéhez, ha .
Sok valóságos problémában az vagy paraméter (vagy mindkettő) lehet ismeretlen. Ebben az esetben a mintában lévő 1 típusú objektumok száma, az megfigyelésünkön alapuló ismeretlen paraméterek érdekelnek minket. Feltételezzük, hogy kezdetben a mintavétel visszatevés nélüli, a legtöbb alkalmazásban ez a reális elrendezés.
Tételezzük fel, hogy a populáció mérete, ismert, de az 1 típusú objektuomok száma, ismeretlen. Ez a probléma például akkor keletkezhet, ha van gyárilag készült tételünk, amely ismeretlen számú selejtes tételt tartalmaz. Nagyon költséges (és esetleg a tesztelt elemet is károsító/megsemmisítő) megvizsgálni mind az elemet, így ehelyett kiválasztunk elemet és azokat vizsgáljuk meg selejtesség szempontjából.
-nek egy minta becslése levezethető, remélve, hogy az 1 típusú objektumok mintabeli aránya közel van az 1 típusú objektumok populációbeli arányához. Azaz
.Mutassuk meg, hogy .
Az előző gyakorlat eredménye azt jelenti, hogy torzítatlan becslése -nek. Ezért a szórásnégyzet a becslés minőségének a mértéke, átlagos négyzetes eltérés értelemben.
Mutassuk meg, hogy .
Mutassuk meg, hogy fix és esetén ha .
Így a becslés javítható, amint a mintaméret nő; ez a tulajdonság konzisztencia néven ismert.
A golyó és urnakísérletben válasszuk a visszatevés nélküli mintavételt. A paraméterek kiválasztott értékeire végezzük el a kísérletet 100-szor, mindegyik kísérlet után frissítve.
Tételezzük fel, hogy az 1 típusú objektumok száma, ismert, de a populációs méret, ismeretlen. Egy ilyen típusú probléma a következő: tételezzük fel, hogy egy egy tóban hal van, ahol ismeretlen. Kifogunk halat és megjelöljük őket, majd visszadobjuk őket a tóba. Ezekután kifogunk halat és közöttük legyen az ebben a mintában megjelölt halak száma. Ebből az adatból meg szeretnénk becsülni a populáció méretét, azaz értékét. Ebben az összefüggésben a becslési problémát néha fogás-újrafogás problémának nevezzük.
Gondolja, hogy a mintavételi modell fő feltételét - nevezetesen az egyfomán valószínűségű mintákat - teljesíti a valódi fogás-újrakifogás problémája? Válaszát magyarázza meg!
Mégegyszer le tudjuk vezetni -nek a mintabecslését remélve, hogy az 1 típusú objektumok mintabeli hányada közel van az 1 típusú objektumok populációs hányadához. Azaz,
Ilymódon ha és definiálatlan, ha .
A golyó és urnakísérletben válasszuk a visszatevés nélküli mintavételt. A paraméterek kiválasztott értékeire végezzük el a kísérletet 100-szor, mindegyik kísérlet után frissítve.
Mutassuk meg, hogy ha akkor maximalizálja függvényt, mint függvényét, fix és esetén. Ez azt jelenti, hogy maximum likelihood becslése.
Felhasználva a Jensen egyenlőtlenséget mutassuk meg, hogy .
Így a becslés torzítatlan és felülről tartva becsli -et. Valóban, ha , úgy, hogy akkor .
Az becslésének egy másik megközelítését a Rendezett statisztikák részben ismerjük meg.
Tételezzük fel, hogy a mintavétel visszatevéses, annak ellenére, hogy a legtöbb alkalmazásban ez irreális feltevés. Ebben az eseten binomiális eloszlású és paraméterekkel.
Mutassuk meg, hogy
Így becslése ismert -mel mégis torzítatlan, de az átlagos négyzetes hibája nagyobb. Így a visszatevés nélküli mintavétel jobban működik a paraméterek minden értékére, mint a visszatevéses mintavétel.
A golyó és urnakísérletben válasszuk a viszarevéses mintavételt. A paraméterek kiválasztott értékeire végezzük el a kísérletet 100-szor, mindegyik kísérlet után frissítve.
100 számítógépes chip között 10 hibás. A 100-ból véletlenszerűen választunk ötöt visszatevés nélkül.
Egy klubnak 50 tagja van; 20 férfi és 30 nő. Véletlenszerűen válaztanak egy 10 tagú bizottságot.
Egy kis tó 1000 halat tartalmaz, melyekből 100 meg van jelölve. Tételezzük fel, hogy 20 halat kifogtunk.
Egy bizonyos körzetben lévő regisztrált szavazók negyven százaléka az jelöltet támogatja. Tételezzük fel, hogy véletlenszerűn kiválasztunk 10 szavazót.
Tételezzük fel, hogy 100 memóriachipből véletlenszerűen és visszatevés nélkül vettünk egy 10 elemű mintát. A chipeket ellenőriztük és 2 hibásnak bizonyult. Becsüljük meg a teljes mintában lévő hibás chipek számát.
Egy választókörzetben 5000 regisztrált választó van. Tételezzük fel, hogy véletlenszerűen kiválasztunk 100 választót, akik szavaztak és 40 az jelöltet támogatta. Becsüljük meg a körzetben levő azon választok számát, akik az jelöltet támogatják.
Egy bizonyos tóból 200 halat kifogtak, megjelöltek, majd visszadobták a tóba. Ezek után kifogtak 100 halat, melyek közül 10 volt megjelölve. Becsüljük meg a tóban lévő halak számát.
Emlékeztetünk arra, hogy az általános kártyakísérletben véletlenszerűen kiválasztunk kártyát visszatevés nélkül az 52 lapos kártyacsomagból. Az speciális eset a póker kísérlet, az eset a bridge kísérlet.
Egy póker kézben adjuk meg az alábbi változók sűrűségfüggvényét, várható értékét és szórásnégyzetét:
Egy bridge kézben adjuk meg az alábbi változók sűrűségfüggvényét, várható értékét és szórásnégyzetét:
Majdnem minden parametrikus valószínűségi modellben érdekes kihívás az, hogy elvégezzük egy vagy több paraméter randomizálását. A megfelelő módszer gyakran vezet egy érdekes parametrikus modellhez, mivel a randomizált paraméter eloszlása maga is egy paramétercsaládhoz tartozik. Ez a Bayes tételnek egy természetes alkalmazása.
Ebben a részben az alap hipergeometrikus modell 1 típusú objektumainak számát randomizáljuk. Speciálisan tételezzük fel, hogy a populációban objektumunk van. Továbbá az 1 típusú objektumok fix száma helyett tételezzük fel, hogy a populációban lévő objektum mindegyike egymástól függetlenül, 1 típusú objektum valószínűséggel és 0 típusú objektum valószínűséggel lehet. Egy paramétert, az -t kiküszöböltük, az új paraméter, értékeit a intervallumból veszi. Jelölje a populációban az -edik típusú objektumot, ilymódon paraméterű Bernoulli kísérleteknek egy sorozata. Jelölje a populációban lévő 1 típusú objektumok számát, így és paraméterű binomiális eloszlású.
Mint az előbb, vegyünk egy objektumból álló mintát a populációból. Jelölje ismét a mintavétel -edik objektumát, és jelölje a mintában lévő 1 típusú objektumok számát. A visszatevéses és a visszatevés nélküli mintavételt is vizsgáljuk. Az első esetben a minta mérete csak poiztív egész lehet, de a második esetben a minta mérte nem haladhatja meg a populáció méretét. A randomizált urna elemzésében a kulcs-technika a -re vonatkozó feltétel. Ha tudjuk, hogy , akkor a modell az előbb tanulmányozott esetre redukálódik: elemű populáció 1 típusú objektummal és mintamérettel.
Mutassuk meg, hogy bármelyik típusú mintavétel esetén
Így bármelyik modellben, azonos eloszlású indikátor változóknak egy sorozata. No, és mi van a függetlenséggel?
Tételezzük fel, hogy a mintavétel visszatevés nélküli. Legyen és legyen továbbá Mutassuk meg, hogy
A előző gyakorlatból az együttes eloszlást használva látjuk, hogy paraméterű Bernoulli kísérleteknek egy sorozata, és ezért binomiális eloszlású és paraméterekkel. Közvetlenül is tudjuk igazolni, hogy Bernoulli kísérleteknek egy sorozata azzal a magyarázattal, hogy a -nek egy véletlenszerűen választott részhalmaza.
Tételezzük fel, hogy a mintavétel visszatevéses. Legyen és legyen Mutassuk meg, hogy
együttes eloszlására egy , , és paraméterekkel kifejezett zárt formulát adni nem könnyű, de legalább azt könnyű látni, hogy az együttes eloszlás nem lesz ugyanaz, mint a visszatevés nélküli mintavételnél. Így egy független sorozat. Megjegyezzük továbbá, hogy egy cserélhető sorozat, mivel az együttes eloszlás invariáns a koordináták permutációjára (ez egy egyszerű következménye annak a ténynek, hogy együttes eloszlás csak az összegtől függ).
Megjegyezzük, hogy
Számítsuk ki a típus változó párok kovarianciáját és korrelációját, amikor a mintavétel visszatevéses. Tételezzük fel, hogy és különböző indexek. Mutassuk meg, hogy
Most megkaphatjuk várható értékét és szórásnégyzetét. Mutassuk meg, hogy
Fejezzük be egy érdekes megfigyeléssel: randomizált urna esetén független változóknak egy sorozata, amikor a mintavétel visszatevés nélküli, de függő változóknak egy sorozata, amikor a mintavétel visszatevéses -- éppen az ellenkezője a fix számú 1 típusú objektumú determinisztikus urnának.