]> A születésnap problémája
  1. Virtuális laboratóriumok
  2. 11. Véges mintavételi modellek
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6
  9. 7
  10. 8
  11. 9

6. A születésnap problémája

Bevezetés

A mintavételi modell

Mint az alap mintavételi modellben, tételezzük fel, hogy véletlenszerűen kiválasztunk n számot visszatevéssel a D 1 2 m populációból. Így az eredményvektor

X X 1 X 2 X n

ahol X i D az i -edik kiválasztott. Emlékeztetünk arra, hogy az alapmodell feltevése az, hogy X egyenletes eloszlású az

S D n 1 2 m n mintatéren.

Ebben a részben a mintából hiányzó populációs értékek száma és a mintában lévő (különböző) populációs értékeknek a száma érdekel minket. A valószínűségek kiszámítását, amelyek kapcsolatban állnak ezekkel a valószínűségi változókkal, általában úgy nevezik, hogy születésnapi problémák. Gyakran, a mintavételi kísérletet úgy értelmezzük, mint n golyónak m rekeszbe (dobozba) való szétosztását; X i az i . golyó dobozának a száma. Ebben az értelmezésben minket az üres dobozok száma és a foglalt dobozok száma érdrkel.

Polinomiális eloszlás

i D -re jelölje Y n i azon alkalmaknak a számát, amikor i előfordul a mintában:

Y n i j 1 2 n X j i

Mutassuk meg, hogy Y n Y n 1 Y n 2 Y n m polinomiális eloszlású n és 1 m 1 m 1 m paraméterekkel:

Y n 1 k 1 Y n 2 k 2 Y n m k m n k 1 k 2 k m 1 m n k 1 k 2 k m m  esetén  i 1 m k i n  értékekkel 

Valószínűségi változók

Most definiáljuk a fő (minket érdelkő) valószínűségi változókat: a mintában a hiányzó populációs értékek számát:

U m n j 1 2 m Y n j 0

és a mintában előforduló (különböző) populációs értékeknek a számát:

V m n j 1 2 m Y n j 0

Nyilvánvaló, hogy U m n V m n m így miután egy változónak ismert az eloszlása és momentuma, könnyen megtalálhatjuk a másik változóra is ezeket. Először a születésnap probléma legegyszerűbb esetét oldjuk meg.

Az egyszerű születésnap probléma

Az az esemény, hogy a mintában létezik legalább egy duplikátum, a következőképpen írható fel:

B m n V m n n U m n m n

Az egyszerű születésnap probléma abból áll, hogy kiszámítsuk ennek az eseménynek a valószínűségét. Például, tételezzük fel, hogy véletlenszerűen kiválasztunk n személyt és feljegyezzük születésnapjaikat. Ha a szökőévet figyelmen kívül hagyjuk és feltesszük, hogy a születésnapok egyenletes eloszlásúak egész éven át, akkor alkalmazzuk az egyszerű mintavételi modellünket m 365 értékkel. Ezzel a beállítással a születésnap probléma az, hogy kiszámítsuk annak valószínűségét, hogy legalább két személynek ugyanakkor van a születésnapja (Ez a speciális eset a probléma "névadója").

A születésnap probléma megoldása a kombinatorikus valószínűség egy egyszerű feladata.

Felhasználva a kombinatorika szorzási szabályát mutassuk meg, hogy

B m n 1 m n m n n m 1 n m

Útmutatás: Az S B m n komplementer esemény akkor és csak akkor következik be, ha az X eredményvektor, egy a D 1 2 m -ből vett n méretű permutációvektort alkot.

A tényre, hogy n m esetén a valószínűség 1, néha úgy hivatkozunk, mint a galambdúc elvre: ha több, mint m galambot helyezünk el m oduba, akkor legalább egy oduba 2, vagy több galamb kerül.

Az ismétlődő kapcsolat

Jelölje p m n a komplementer esemény valószínűségét, S B m n , hogy a mintaváltozók különböznek. Bizonyítsuk be a következő rekurzív összefüggést két módon: először a 2. gyakorlat eredményéből kiindulva, majd ezután felhasználva a feltételes valószínűségről tanultakat.

  1. p m 1 1
  2. p m n 1 m n m p m n

Példák

Legyen m 365 (a standard születésnapi probléma). Ellenőrizzük a következő születésnappal kapcsolatos valószínűségeket:

  1. B 365 10 0.117
  2. B 365 20 0.411
  3. B 365 30 0.706
  4. B 365 40 0.891
  5. B 365 50 0.970
  6. B 365 60 0.994

Ábrázoljuk az előző gyakorlatban lévő értékeket, mint n függvényét. Amikor a görbe sima (a forma kedvéért), az alábbi görbére fog hasonlítani.

Probability of the birthday event

A születésnap kísérletben legyen m 365 és válasszuk a indikátor változót I -nek. n 10 20 30 40 50 60 -ra végezzük el a kísérletet 1000-szer és számítsuk ki annak az eseménynek a relatív gyakorisását, hogy a minta tartalmaz duplikációt. Hasonlítsuk össze a relatív gyakoriságokat az előző gyakorlatban kiszámított valószínűségekkel.

A könnyű megoldás ellenére, a születésnap probléma híres probléma, mert numerikusan, a valószínűségek egy kicsit meglepőek. Megjegyezzük, hogy éppen 60 személy esetén az esemény majdnem biztos. Matematikailag a születésnap-valószínűség gyors növekedése (amint n növekszik) annak a ténynek köszönhető, hogy m n sokkal gyorsabban nő, mint m n .

Négy szabályos dobókockát feldobunk. Adjuk meg annak valószínűségét, hogy a dobott számok különbözőek.

A születésnap kísérletben, legyen m 6 és válasszuk indikátorváltozónak I -t. Változtassuk n értékét a görgetősávval és figyeljük meg a grafikonon, hogyan változnak a valószínűségek. Most n 4 -re végezzük el a kísérletet 1000-szer, 10-esével frissítve a gyakoriságokat. Figyeljük meg az esemény relatív gyakoriságának nyilvánvaló konvergenciáját a megfelelő valószínűséghez.

Véletlenszerűen választunk 5 személyt.

  1. Adjuk meg annak valószínűségét, hogy legalább két személynek ugyanakor van a születési hónapja!
  2. Bíráljuk el a mintavételi modellt ebben az elrendezésben!

A születésnap kísérletben, legyen m 12 és válasszuk indikátorváltozónak I -t. Változtassuk n -et a görgetősávval és figyeljük meg a grafikonon, hogyan változnak a valószínűségek. Most n 5 -re végezzük el a kísérletet 1000-szer, 10-esével frissítve a gyakoriságokat. Figyeljük meg az esemény relatív gyakoriságának nyilvánvaló konvergenciáját a megfelelő valószínűséghez..

Egy gyorsétterem 10 különböző játékból ajándékoz egyet gyermekadag vásárlásakor. Egy család 5 gyermeknek 5 gyermakadagot vásárol. Adjuk meg annak valószínűségét, hogy a kapott 5 játék különböző!

A születésnap kísérletben, legyen m 10 és válasszuk indikátorváltozónak I -t. Változtassuk n -et a görgetősávval és figyeljük meg a grafikonon, hogyan változnak a valószínűségek. Most n 5 -re végezzük el a kísérletet 1000-szer, 10-esével frissítve a gyakoriságokat. Figyeljük meg az esemény relatív gyakoriságának nyilvánvaló konvergenciáját a megfelelő valószínűséghez.

Legyen m 52 . Adjuk meg n legkisebb értékét, amelyre a duplikáció valószínűsége legalább 12 .

Az általános születésnapi probléma

Térjünk vissza az általánosabb problémához: megadni a különböző mintaértékek számának eloszlását és a kimaradt mintaértékek számának eloszlását.

A sűrűségfüggvény

j D -re vizsgáljuk azt az eseményt, hogy j nem fordul elő a mintában: A n j Y n j 0 . Most legyen K D K k kikötéssel. Felhasználva a kombinatorika szorzási szabályát, könnyű megszámlálni azon mintáknak a számát, amelyek nem tartalmazzák K minden elemét:

Mutassuk meg, hogy

j K A n j m k n

Most a kombinatorika tartalmazás-kizárás szabályát használva ki tudjuk számolni azon mintáknak a számát, amikor legalább egy populációs érték hiányzik:

Mutassuk meg, hogy

j 1 m A n j k 1 m 1 k 1 m k m k n

Először is láthatjuk, hogy egyszerű megszámolni azon minták számát, amelyek nem tartalmazzák az összes populációs értéket:

Mutassuk meg, hogy

j 1 m A n j c k 0 m 1 k m k m k n

Most használhatunk egy kétlépéses eljárást, amivel az összes mintát, generálhatjuk, amiből pontosan j darab populációs érték marad ki:

  1. Először válasszuk ki a j darab értéket, amiket ki akarunk zárni.
  2. Majd válasszuk ki egy n elemű mintát a maradék populációs értékekből, ezeknek már egyikét sem kell kizárni.

Így alkalmazhatjuk a kombinatorika szorzási szabályát, hogy megszámoljuk azon minták számát, melyekből j darab populációs érték hiányzik.

Mutassuk meg, hogy

U m n j n j k 0 m j 1 k m j k m j k n

Végül, mivel X eloszlása az S mintatéren egyenletes, meg tudjuk adni a kizárt értékek számának sűrűségfüggvényét:

Mutassuk meg, hogy

U m n j n j k 0 m j 1 k m j k 1 j k m n ,  j m n 0 m 1

Könnyen meg tudjuk adni a mintában lévő különböző értékek számának sűrűségfüggvényét:

Mutassuk meg, hogy

V m n j n j k 0 j 1 k j k j k m n ,  j 1 2 m n

A születésnap kísérletben, válasszuk meg a különböző mintaértékek számát. Változtassuk a paramétereket és figyeljük meg a sűrűségfüggvény helyét és alakját. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve és figyeljük meg a relatív gyakoriság függvény nyilvánvaló konvergenciáját az elméleti sűrűségfüggvényhez.

Egy ismétlődő kapcsolat

A kizárt értékek számának eloszlását megkaphatjuk egy rekurziós okoskodással is.

Legyen p m n j U m n j j m n 0 m 1 esetén. Felhasználva valószínűségszámítási érveket mutassuk meg, hogy

  1. p m 1 m 1 1
  2. p m n 1 j m j m p m n j j 1 m p m n j 1

Momentumok

Most megkeressük a várható értékeket és a szórásnégyzeteket. A kizárt értékek száma és a különböző értékek száma számláló változók és ezért felírhatók, mint indikátorváltozók összegei. Mint már láttuk sok modellben, ez a reprezentáció gyakran a legjobb a momentumok számítására.

Legyen I n j A n j . Így I n j 1 ha A n j bekövetkezik, ami azt jelenti, hogy j nincs a mintában és I n j 0 egyébként. Megjegyezzük, hogy a mintában levő populációs értékek száma felírható, mint indikátor változók összege:

U m n j 1 m I n j

Mutassuk meg, hogy

  1. I n j 1 1 m n j 1 2 m esetén.
  2. I n i I n j 1 2 m n i j 1 2 m 2 esetén i j feltétel mellett.

Felhasználva a 22. gyakorlat eredményét mutassuk meg, hogy

  1. U m n m 1 1 m n
  2. V m n m 1 1 1 m n

Felhasználva a 22. gyakorlat eredményét, mutassuk meg, hogy

  1. I n j 1 1 m n 1 1 m 2 n j 1 2 m esetén
  2. I n i I n j 1 2 m n 1 1 m 2 n i j 1 2 m 2 esetén i j feltétel mellett.

Felhasználva a 24. gyakorlat eredményét és a szórásnégyet elemi tulajdonságait mutassuk meg, hogy

U m n V m n m m 1 1 2 m n m 1 1 m n m 2 1 1 m 2 n

A születésnap kísérletben válasszuk meg a különböző mintaértékek számát. Változtassuk a paramétereket és figyeljük meg az átlag/standard eloszlás ábrájának helyét és méretét. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer 10-esével frissítve és figyeljük meg a minta átlag és szórásnégyzet nyilvánvaló konvergenciáját a várható értékhez és elméleti szórásnégyzethez.

Példák és alkalmazások

Tételezzük fel, hogy véletlenszerűen kiválasztunk 30 személyt.

  1. Adjuk meg a különböző születésnapok számának sűrűségfüggvényét!
  2. Adjuk meg a különböző születésnapok számának várható értékét!
  3. Adjuk meg a különböző születésnapok számának szórásnégyzetét!
  4. Adjuk meg annak valószínűségét, hogy legalább 18 különböző születésnap fordul elő!

A születésnap kísérletben legyen m 365 és n 30 . Végezzük el a kísérletet 1000-szer 10-esével frissítve és számítsuk ki az utolsó gyakorlat (d) részében szereplő esemény relatív gyakoriságát.

Tételezzük fel, hogy 10 szabályos dobókockát dobunk fel.

  1. Adjuk meg a különböző számok sűrűségfüggvényét!
  2. Adjuk meg a különböző számok várható értékét!
  3. Adjuk meg a különböző számok szórásnégyzetét!
  4. Adjuk meg annak valószínűségét, hogy 4 vagy kevesebb különböző számot dobunk!

A születésnap kísérletben legyen m 6 és n 10 . Végezzük el a kísérletet 1000-szer 10-esével frissítve és számítsuk ki az utolsó gyakorlat (d) részében szereplő esemény relatív gyakoriságát.

Egy gyorsétteremben 10 különböző játék valamelyikét adják mindegyik gyerek menü vásárlásakor. Egy család 15 gyermekadagot vásárol.

  1. Adjuk meg azon játékok számának sűrűségfüggvényét, amelyek hiányoznak a kapott játékokból!
  2. Adjuk meg azon játékok számának várható értékét, amelyek hiányoznak a kapott játékokból!
  3. Adjuk meg azon játékok számának szórásnégyzetét, amelyek hiányoznak a kapott játékokból!
  4. Adjuk meg annak valószínűségét, hogy legalább 3 játék hiányzik a kapott játékokból!

A születésnap kísérletben legyen m 10 és n 15 . Végezzük el a kísérletet 1000-szer 10-esével frissítve és számítsuk ki az utolsó gyakorlat (d) részében szereplő esemény relatív gyakoriságát.

A hazug hallgatók problémája. Tételezzük fel, hogy 3 hallgató, akik együtt utaznak, hiányoznak egy matematikavizsgáról. Elhatározzák, hogy azt hazudják az oktatónak, hogy az autó kereke defektes lett. Az oktató elkülönítette a három hallgatót egymástól és mindegyiküket egyenként megkérdezte, hogy mi okozta a kerék defektjét. A hallgatók, akik ezt nem látták előre, véletlenszerűen és egymástól függetlenül válaszoltak.

  1. Adjuk meg a különböző válaszok számának sűrűségfüggvényét!
  2. Speciálisan adjuk meg annak valószínűségét, hogy a hallgatók megússzák a csalásukat!
  3. Adjuk meg a különbözö válaszok számának várható értékét!
  4. Adjuk meg a különbözö válaszok számának standard szórását!

A kacsavadász probléma. Tételezzük fel, hogy van 5 kacsavadász, mindegyikük kifogástalan lövő. Egy 10 kacsából álló csapat repül felettük, és mindegyik kacsavadász véletlenszerűen kiválaszt magának egy kacsát és lő.

  1. Adjuk meg a lelőtt kacsák számának sűrűségfüggvényét!
  2. Adjuk meg a lelőtt kacsák számának várható értékét!
  3. Adjuk meg a lelőtt kacsák számának standard szórását!