]>
Tételezzük fel, hogy populációnk 1-től -ig van számozva úgy, hogy . Például, a populáció állhat gyárilag előállított tételekből és ezeket megjelölhetjük a megfelelő sorozatszámokkal. Mint az alap mintavételi modellben válasszunk véletlenszerűen visszatevés nélkül objektumot -ből:
ahol az -edik választott objektum. Emlékeztetünk arra, hogy egyenletes eloszlású a -ből választott elemű permutációk halmaza fölött. Emlékeztetünk arra, hogy
egy rendezetlen minta, amely egyenletes eloszlású a kombinációk elemű -ből vett halmaza fölött.
esetén legyen
halmaznak.Az valószínűségi változó az minta esetén, mint az -edik rendstatisztika ismert. Megjegyezzük, hogy a szélső (extrémális) statisztikák:
Mutassuk meg, hogy értékeit az halmazból veszi.
A rendstatisztikák vektorát jelöljük
-nal.Megjegyezzük, hogy értékeit az halmazból veszi.
Végezzük el a rendstatisztika kísérletet. Figyeljük meg, hogy meg tudjuk változtatni a populáció méretet, -et és a mintaméretet, -et. A rendstatisztikákat mindegyik frissítéskor jegyezzük fel (regisztráljuk).
Mutassuk meg, hogy -nek eleme van és hogy egyenletes eloszlású az halmazon. Útmutatás: akkor és csak akkor, ha és akkor és csak akkor, ha az permutációjának egyike.
Felhasználva egy kombinatorikai összefüggést, mutassuk meg, hogy sűrűségfüggvénye
A rendstatisztika kísérletben változtassuk a paramétereket és figyeljük meg a sűrűségfüggvény helyét és alakját. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve. Figyeljük meg a relatív gyakoriság függvény jól látható konvergenciáját a sűrűségfüggvényhez.
A 4. gyakorlatban a sűrűségfüggvényt megkaphatjuk a binomiális együtthatók egy érdekes azonosságának a felhasználásával. Ez az azonosság használható várható értékének és szórásnégyzetének meghatározásához is.
Mutassuk meg, hogy esetén
Mutassuk meg, hogy
Felhasználva a 6. gyakorlat eredményét mutassuk meg, hogy
A rend statisztika kísérletben változtassuk a paramétereket és figyeljük meg a várható érték/statndard szórás grafikonjának helyét és méretét. A paraméterek kiválasztott értékeire végezzük el a kísérletet 1000-szer, 10-esével frissítve. Figyeljük meg a minta átlagának és standardizát szórásának jól látható konvergenciáját az eloszlás várható értékéhez és standard szórásához.
Felhasználva a 7. gyakorlat eredményeit mutassuk meg, hogy esetén a következő statisztika -nek torzítatlan becslése:
Mivel torzítatlan, szórásnégyzete az átlagos négyzetes hiba, a becslés minőségének a mértéke.
Felhasználva a 8. gyakorlat eredményét, mutassuk meg, hogy
Mutassuk meg, hogy fix -re és -re csökken, mint függvénye. Így, a becslések javíthatók, ha -t növeljük; speciálisan a legjobb és a legrosszabb.
Ellenőrizzük a következő arányt, ami -nek -re vonatkozó relatív hatékonysága néven ismert:
.Megjegyezzük, hogy a relatív hatékonyság csak a és sorrendjétől függ, valamint az mintamérettől, de nem függ az populációs mérettől. Speciálisan -re vonatkozó relatív hatékonysága .
Általában, reméljük, hogy a becslés javítható (átlagos négyzetes hiba tekintetében), ha a minta méretét növeljük (több információ esetén jobb lesz a becslésünk). Ez az általános összefüggés konzisztencia néven ismert.
Ellenőrizzük a következő eredményt. 0-hoz tart, miközben növekszik 1-től -ig, és így konzisztens:
Mutassuk meg, hogy fix esetén először nő, majd csökken 0-ig, ha növekszik -től -ig. Így inkonzisztens (nem konzisztens).
A következő ábra függvényt mutatja, függvényeként esetén.
Ebben a részfejezetben az paraméter egy másik egy másik becslésének levezetését adjuk meg, ami az mintaváltozó átlagán ( röviden mintaátlagon) alapul és összehasonlítjuk ezt a becslést a változó maximumán alapuló becsléssel ( legnagyobb rendstatisztika).
Mutassuk meg, hogy .
Látható, hogy -nek torzítatlan becslése. Továbbá úgy tűnik, hogy látszólag több információt használ a mintából (mivel több mintaváltozót foglal magába) mint . Valóban jobbat? Jöjjünk rá, hogy szükséges kiszámolnunk a becslés szórásnégyzetét (amely mivel torzítatlan, az átlagos négyzetes hibával egyezik meg). Ez a számítás egy kicsit komplikált, mivel a mintaváltozók függetlenek. Ki fogjuk számolni az összeg szórásnégyzetét, mint a a páronként vett kovarianciák összegét.
Mutassuk meg, hogy -re.
Elevenítsük fel, vagy mutassuk meg, hogy .
Mutassuk meg, hogy .
Végül mutassuk meg, hogy .
A 20. gyakorlatban szereplő szórásnégyzet csökken függvényeként, s így becslése konzisztens. Számítsuk ki a várható értéken alapuló becsléshez a maximum szerinti becslés relatív hatékonyságát.
Mutassuk meg, hogy .
Ilymódon, mégegyszer láthatjuk, hogy a maximumon alapuló becslés jobb.
Ha a mintavétel visszatevéses, akkor az minta független és azonos eloszlású valószínűségi változóknak egy sorozata. Az ilyen mintákból vett rendstatisztikákat a Véletlen minták fejezetében tanulmányozzuk.
Tételezzük fel, hogy egy lottójátékban az 1-től 25-ig számozott sorsjegyek egy tálban vannak elhelyezve. Öt sorsjegyet választunk véletlenszerűen, visszatevés nélkül.
Az becslést a szövetségesek felhasználták a II.világháborúban a német tankok számának a becslésére. A német tankoknak volt egy sorozatszámuk és az elfoglalt német tankok valamint hiteles feljegyzések alkották a mintaadatokat. A statisztikai becslésekről kiderült, hogy pontosabbak, mint a hírszerzői becslések. Néhány adatot mellékelünk az alábbi táblázatban.
Dátum | Statistikai becslés | Hírszerzői becslés | Német adatrekordok |
---|---|---|---|
1940. június | 169 | 1000 | 122 |
1941. június | 244 | 1550 | 271 |
1942. augusztus | 327 | 1550 | 342 |
Az eset egy nyilvánvaló tanulsága, hogy ne tegyünk sorozatszámot a fegyverünkre!
Tételezzük fel, hogy egy háborúban 5 ellenséges tankot zsákmányoltunk. Ezek sorozatszáma 51, 3, 27, 82, 65. Számítsuk ki becslését, a tankok teljes számát, felhasználva a fentebb tárgyalt becslések mindegyikét.
A rendstatisztikai kísérletben legyen , . Végezzük el a kísérletet 50-szer, minden kísérlet után frissítve. Mindegyik kísérlet esetén számítsuk ki rendstatisztikáin alapuló becslését. Mindegyik becslésre számítsuk ki a hibanégyzetek átlagának négyzetgyökét az 50 kísérlet után. Ezen empirikus hibabecslés alapján rangsoroljuk becsléseit a becslés pontossága (minősége) szerint!