]> A többváltozós hipergeometrikus eloszlás
  1. Virtuális laboratóriumok
  2. 11. Véges mintavételi modellek
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7
  10. 8
  11. 9

3. A többváltozós hipergeometrikus eloszlás

Alapelmélet

Mint az alap mintavételi modellben, egy véges m objektumból álló D populációból indulunk ki. Ebben a részben feltételezzük, hogy a lehetséges objektum típusok száma k ; azaz van egy u.n. multi-típusú populációnk. Például különböző színű labdákkal tele urnánk, vagy az alábbi típusú választók: demokrata, republikánus, vagy független. Jelölje D i az i típusú objektumok halmazát és legyen m i D i minden i 1 2 k -re. Így

D i 1 k D i ,  m i 1 k m i

A korábban vizsgált dichotom modell nyilvánvalóan egy speciális esete ennek, k 2 értékkel. Mint az alap mintavételi modellnél, egy n elemű véletlen mintát veszünk a D -ből:

X X 1 X 2 X n

ahol X i D azt jelenti, hogy az i -edik objektumot választottuk. Jelölje most Y i a mintában lévő i típusú objektumok számát i 1 2 k -ra. Megjegyezzük, hogy

i 1 k Y i n

így ha ismerjük a számláló válozó k 1 értékét, meg tudjuk adni a megmaradó számláló változó értékét. Mint minden számláló változóval, ki tudjuk fejezni Y i -t, mint indikátor változók össegét:

Mutassuk meg, hogy

Y i j 1 n I i j  ahol  I i j 1 X j D i 0 X j D i

Először tételezzük fel, hogy a mintavétel visszatevés nélküli, mivelhogy a legtöbb alkalmazásban ez egy reális feltevés.

Az együttes eloszlás

Alapvető kombinatorikai érveléseket tudunk használni a számláló változók véletlen vektora sűrűségfüggvényének a levezetéséhez. Emlékezzünk vissza, hogy mivel a mintavétel visszatevés nélküli, a rendezetlen minta egyenletes eloszlású a D -ből vett n -ed osztályú kombinációk felett.

Mutassuk meg, hogy

Y 1 j 1 Y 2 j 2 Y k j k m 1 j 1 m 2 j 2 m k j k m n j 1 j 2 j k k  esetén  i 1 k j i n  értékekkel. 

Y 1 Y 2 Y k eloszlását m , m 1 m 2 m k , és n paraméterű többváltozós hipergeometrikus eloszlásnak nevezzük. Azt is mondjuk, hogy Y 1 Y 2 Y k 1 ezzel az eloszlással rendelkezik (újra emlékeztetünk arra, hogy bármelyik k 1 változónak az értékei meghatározzák a maradék változó értékét). Rendszerint ez nyilvánvaló az összefüggésből, amelynek a jelentését szándékozzuk kifejezni. A normál hipergeometrikus eloszlás megfelel a k 2 értéknek.

Mutassuk meg a többváltozós hipergeometrikus sűrűségfüggvény következő alternatív formáját kétféle módszerrel: kombinatorikusan, a D -ből vett n elemű permutáció felett egyenletes eloszlású rendezett minta vizsgálatával és algebrai módszerrel, a 2. gyakorlat eredményéből kiindulva.

Y 1 j 1 Y 2 j 2 Y k j k n j 1 j 2 j k m 1 j 1 m 2 j 2 m k j k m n j 1 j 2 j k k  esetén  i 1 k j i n  értékekre 

A marginális eloszlások

Mutassuk meg, hogy Y i m , m i és n paraméterű hipergeometrikus eloszlás. Adjunk két valószínűségelméleti igazolást, egy mintavételen alapuló és egy analitikus levezetést, amely a 2. gyakorlatban szereplő együttes sűrűségfüggvényen alapul.

Y i j m i j m m i n j m n ,  j 0 1 n

Csoportosítás

A többváltozós hipergeometrikus eloszlás megőrződik, amikor a számláló változóval kombináljuk. Speciálisan, tételezzük fel, hogy A 1 A 2 A l az 1 2 k indexhalmaznak egy particiója nem üres diszjunkt részhalmazokba. Legyen

W j i A j Y i ,  r j i A j m i j 1 2 l  esetén 

Mutassuk meg, hogy W 1 W 2 W l m , r 1 r 2 r l , és n paraméterű hipergeometrikus eloszlású.

Feltételezés

A többváltozós hipergeometrikus elsozlás akkor is megőrződik, amikor több számlálóváltozót figyelünk meg. Speciálisan tételezzük fel, hogy A B az 1 2 k indexhalmaznak egy particiója nem üres diszjunkt részhalmazokba. Tételezzük fel, hogy megfigyeljük az Y j y j eseményt j B -re. Legyen

z j B y j ,  r i A m i

Mutassuk meg, hogy Y i i A feltételes eloszlása Y j y j j B feltétel mellett r , m i i A , és z paraméterű többváltozós hipergeometrikus eloszlású.

Az 5. gyakorlat és a 6. gyakorlat alaperedményeit kombinálva ki tudjuk számolni mindegyik marginális eloszlás vagy a számláló változók feltételes eloszlásait.

Momentumok

Ki fogjuk számolni a számláló változók várható értékét, szórásnégyzetét, kovarianciáját, és korrelációját. Az eredményekhez a legfontosabb eszközöket a hipergeometrikus eloszlásból és az 1. gyakorlatban az indikátor változóval kapcsolatos reprezenátcióból nyerjük.

Mutassuk meg, hogy i 1 2 k esetén

  1. Y i n m i m
  2. Y i n m i m 1 m i m m n m 1

Tételezzük fel, hogy i és j az 1 2 k különböző elemei és hogy r valamint s 1 2 n különböző elemei. Mutassuk meg, hogy

  1. I i r I j r m i m j m 2
  2. I i r I j s m i m j m 2 m 1

Tételezzük fel, hogy i és j 1 2 k különböző elemei és hogy r valaimnt s 1 2 n különböző elemei. Mutassuk meg, hogy

  1. I i r I j r m i m j m m i m m j
  2. I i r I j s m i m j m m i m m j m 1

Speciálisan, I i r és I j s különböző i -re és j -re, minden r és s esetén negatívan korreláltak. Ez az eredmény ésszerűnek tűnik?

Felhasználva a 7. gyakorlat és a 8. gyakorlat eredményét, mutassuk meg, hogy az 1 2 k -ből vett különböző i és j esetén

  1. Y i Y j n m i m j m 2 m n m 1
  2. Y i Y j m i m j m m i m m j

Visszatevéses mintavétel

Tételezzük fel, hogy a mintavétel visszatevéses, annak ellenére, hogy ez rendszerint az alkalmazásokban nem valószerű.

Mutassuk meg, hogy a mintában lévő objektumok típusai egy m 1 m m 2 m m k m paraméterű n polinomiális kísérlet egy sorozatából vett minta elemei.

A következő eredmények a polinomiális kísérletek általános elméletőből közvetlenül származtathatók, annak ellenére, hogy a fenti bizonyítások módosítását használhatjuk.

Mutassuk meg, hogy Y 1 Y 2 Y k n és m 1 m m 2 m m k m paraméterű polinomiális eloszlású.

Y 1 j 1 Y 2 j 2 Y k j k n j 1 j 2 j k m 1 j 1 m 2 j 2 m k j k m n j 1 j 2 j k k  esetén  i 1 k j i n  értékekre 

Mutassuk meg, hogy 1 2 k -ből vett különböző i és j értékekre

  1. Y i n m i m
  2. Y i n m i m 1 m i m
  3. Y i Y j n m i m j m 2
  4. Y i Y j m i m j m m i m m j

Polinomiális eloszlás konvergenciája

Tételezzük fel, hogy a populáció mérete m az n mintamérethez viszonyítva nagyon nagy. Ebben az esetben az tűnik elfogadhatónak, hogy a visszatevés nélküli mintavétel nem nagyon különbözik a visszatevéses mintavételtől és ezért a többváltozós hipergeometrikus eloszlást polinomiális eloszlással jól tudjuk közelíteni. A következő gyakorlat ezt teszi pontosabbá. Gyakorlatilag ez értékelhető eredmény, mivel sok esetben nem ismerjük pontosan a populáció méretét.

Tételezzük fel, hogy m i m -től függ és, hogy m i m p i ha m i 1 2 k -re. Mutassuk meg, hogy fix n esetén az m , m 1 m 2 m k , és n paraméterű többváltozós hipergeometrikus sűrűségfüggvény az n és p 1 p 2 p k paraméterű polinomiális sűrűségfüggvényhez konvergál. Útmutatás: Használjuk a 3. gyakorlatban szereplő reprezentációt.

Példák és alkalmazások

Egy 100 szvazóból álló populációban 40 republikánus, 35 demokrata és 25 független van. Válasszunk egy 10 elemű véletlen mintát.

  1. Adjuk meg a mintában lévő republikánusok számának, demokraták számának és függetlenek számának együttes sűrűségfüggvényét!
  2. Adjuk meg az (a)-ban szereplő változók mindegyikének várható értékét!
  3. Adjuk meg az (a)-ban szereplő változók mindegyikének szórásnégyzetét!
  4. Adjuk meg az (a)-ban szereplő változópárok mindegyikének kovarianciáját!
  5. Adjuk meg annak valósínűségét, hogy a minta legalább 4 republikánust, legalább 3 demokratát és legalább 2 függetlent tartalmaz!

Kártyák

Emlékeztetünk arra, hogy az általános kártyakísérlet abból áll, hogy n kártyát választunk az 52 lapos kártyacsomagból véletlenszerűen, visszatevés nélkül. Az n 5 speciális eset a póker kísérlet, és az n 13 speciális eset a bridge kísérlet.

A bridge leosztásban (egy bridge kézben) adjuk meg

  1. a pikkek számának, a kőrök számának és a kárók számának (együttes) sűrűségfüggvényét.
  2. a pikkek számának és a kőrök számának (együttes) sűrűségfüggvényét.
  3. a pikkek számanak sűrűségfüggvényét.
  4. A piros színű lapok és a fekete színű lapok (együttes) sűrűségfüggvéyét.

Egy bridge kézben

  1. Adjuk meg a pikkek számának várható érétkét és szórásnégyzetét.
  2. A pikkek száma és a kőrök száma közötti kovarianciát és korrelációt.
  3. Adjuk meg a piros kártyák számának várható értékét és korrelációját.

Egy bridge kézben

  1. Adjuk meg a pikkek számának és a körök számának együttes sűrűségfüggvényét, azon fetétel mellett, hogy a kézben 4 pikk van.
  2. Adjuk meg a pikkek számának feltételes sűrűségfüggvényét azon feltétel mellett, hogy a kézben 3 kör és 2 pikk van.

Ha egy kártyakísérletben egy kéz nem tartalmaz valamilyan színt, akkor azt mondjuk, hogy színmentes ebből a színből.

Felhasználva a bennfoglalás-kizárás szabályt mutassuk meg, hogy annak a valószínűsége, hogy egy pókerkéz legalább egy színből színmentes

19134962598960 0.736

A kártyakísérletben, legyen n 5 . Végezzük el a kísérletet 1000-szer, minden kísérlet után frissítve. Számítsuk ki annak az eseménynek a relatív gyakoriságát, hogy a kéz legalább egy színből színmentes. Hasonlítsuk össze a relatív gyakoriságot az előző gyakorlatban megadott valódi valószínűséggel.

Felhasználva a bennfoglalás-kizárás szabályt mutassuk meg, hogy annak a valószínűsége, hogy egy bridge kéz színmentes legalább egy színben

32427298180635013559600 0.051