]> A kupongyűjtő probléma
  1. Virtuális laboratóriumok
  2. 11. Véges mintavételi modellek
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7
  10. 8
  11. 9

7. A kupongyűjtő probléma

Alapelmélet

Valószínűségi változók

Ebben a fejezetben véletlen kísérletünk az, hogy újra-meg újra mintát veszünk visszatevéssel a D 1 2 m populációból. Ez független valószínűségi változóknak egy sorozatát generálja, mindegyikük egyenletes eloszlású a D halmazon:

X X 1 X 2

Gyakran fogjuk interpretálni a mintavételt a kupongyűjtővel kifejezve: mindig, amikor a gyűjtő megvásárol egy bizonyos terméket (például rágógumit, vagy Cracker Jack-et), kap egy kupont (például egy baseball kártyát, vagy egy játékot), amely m típus közül lehet az egyik, azonos valószínűséggel. Így ebben az elrendezésben X i D a kupon típusa, amit az i -edik vásárláskor kapunk.

Jelölje V m n az első n vásárlásban a különböző értékek számát n -re. Ez a születésnapi probléma fejezetének utolsó részében vizsgált (tanulmányozott) valószínűségi változó. Figyelmünket ebben a fejezetben a minta méretére fordítjuk, hogy k különböző mintaértéket kapjunk k 1 2 m -re. Így legyen

W m k n V m n k .

A kupongyűjtéssel kapcsolatban ez a valószínűségi változó azt a megvásárolandó termékszámot adja meg, ami ahhoz kell, hogy k különböző kupontípust kapjunk. Megjegyezzük, hogy W m k különböző értékeinek a halmaza k k 1 . Különösen az érdekel minket, hogy mennyi W m m , vagyis a mintaméret ahhoz, hogy megkapjuk a teljes populációt. A kupongyűjtéssel megfogalmazva: ennyi terméket kell megvásárolni ahhoz, hogy megkapjuk a teljes kupon halmazt.

A kupongyűjtés kísérletben a paraméterek kiválasztott értékeire néhányszor végezzük el a kisérletet lépésenként megszakított módszerrel.

A sűrűségfüggvény

Most találjuk meg W m k eloszlásfüggvényét. Az előző rész eredményei nagyon hasznosak lesznek.

Lássuk be, hogy W m k n akkor és csak akkor, ha V m n 1 k 1 és V m n k .

Felhasználva a 2. gyakorlatot és a feltételes valószínűségről tanultakat mutassuk meg, hogy

W m k n m k 1 m V m n 1 k 1

Felhasználva az előző gyakorlat eredményét és az utolsó részben szerepelt V m n 1 eloszlását, mutassuk meg, hogy

W m k n m 1 k 1 j 0 k 1 1 j k 1 j k j 1 m n 1 ,  n k k 1

A kupongyűjtés kísérletben változtassuk a paramétereket és figyeljük meg a sűrűségfüggvény helyzetét és alakját. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve és figyeljük meg a relatív gyakoriság függvény sűrűségfüggvényhez való nyilvánvaló konvergenciáját.

Rekurziós formula

A mintaméret eloszlásának egy alternatív megközelítéséhez szükség van k különböző értékre egy rekurziós formula segítségével.

Legyen p m k n W m k n Felhasználva a feltételes valószínűségről tanultakat, mutassuk meg, hogy

p m k n 1 k 1 m p m k n m k 1 m p m k 1 n

Dekompozíció

Meg fogjuk mutatni, hogy W m k k független, geometriai eloszlású valószínűségi változó dekompozíciója lehet. Ez további betekintést nyújt az eloszlás természetébe és könnyen elvégezhetővé teszi a várható érték és a szórásnégyzet számítását.

i 1 2 m , esetén jelölje Z m i a további minták számát, amelyek szükségesek ahhoz, hogy az i 1 különböző értéket tartalmazó mintából i különböző értékű legyen.

Bizonyítsuk be, hogy

  1. Z m 1 Z m 2 Z m m független valószínűségi változóknak egy sorozata.
  2. Z m i geometriai eloszlású az halmazon, p m i m i 1 m paraméterrel.
  3. W m k i 1 k Z m i

A 7. gyakorlat világosan mutatja, hogy minden alkalommal, amikor egy új kupont kaptunk, az nehezebbé teszi a következő új kuponhoz való jutást.

A kupongyűjtés kísérletben a paraméterek kiválasztott értékeire végezzük el a kísérletet néhányszor a lépésenként megszakított módszerrel. Speciálisan próbáljuk meg ezt nagy m és m -hez közeli k értékre.

Momentumok

Felhasználva a 7. gyakorlat eredményeit, mutassuk meg, hogy

  1. W m k i 1 k m m i 1
  2. W m k i 1 k i 1 m m i 1 2

A kupongyűjtés kísérletben változtassuk a paramétereket és figyeljük meg a várható érték/standard szórás grafikonjának helyét és alakját. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve és figyeljük meg a mintaátlag és a standard szórás nyilvánvaló konvergenciáját a várható értékhez és az elméleti standard szóráshoz.

Felhasználva a 7. gyakorlat mutassuk meg, hogy W m k

generátorfüggvénye t W m k i 1 k m i 1 m i 1 t ,  t m k 1

Példák és alkalmazások

Tételezzük fel, hogy addig veszünk mintát egy emberekből álló populációból, ameddig nem kapunk 40 különböző születésnapot.

  1. Adjuk meg a mintaméret sűrűségfüggvényét!
  2. Adjuk meg a mintaméret várható értékét!
  3. Adjuk meg a mintaméret szórásnégyzetét!
  4. Adjuk meg a mintaméret generátorfüggvényét!

Tételezzük fel, hogy egy szabályos dobókockát addig dobunk, amíg 6-ost nem dobunk.

  1. Adjuk meg a szükséges dobásszám sűrűségfüggvényét!
  2. Adjuk meg a szükséges dobásszám várható értékét!
  3. Adjuk meg a szükséges dobásszám szórásnégyzetét!
  4. Adjuk meg annak valószínűségét, hogy legalább 10-et dobtunk!

Egy bizonyos gabonapehely-márkának a doboza egy speciális játékot tartalmaz. Mindegyik dobozban 10 különböző játék valamelyike van elhelyezve. Egy gyűjtő mindaddig vásárol dobozokat, ameddig össze nem gyűjti a 10 játékot.

  1. Adjuk meg a megvásárolt dobozok számának sűrűségfüggvényét!
  2. Adjuk meg a megvásárolt dobozok számának várható értékét!
  3. Adjuk meg a megvásárolt dobozok számának szórásnégyzetét!
  4. Adjuk meg annak valószínűségét, hogy nem több, mint 15 dobozt vásárolt a gyűjtő!