]>
Tételezzük fel, hogy van egy alap véletlen kísérletünk és hogy valós értékű valószínűségi változó eloszlásfüggvényel és sűrűségfüggvénnyel.
Hajtsunk végre független alapkísérletet, hogy generáljunk egy méretű eloszlásból vett véletlen mintát. Emlékeztetünk arra, hogy ez független véletlen változóknak egy sorozata, melyek mindegyikének az eloszlása megegyezik eloszlásával.
Jelölje az minta -adik legkisebb elemét. Ezt a statisztikát rendstatisztikának nevezzük, s azt mondjuk, hogy a rendje . Statisztikai elemzéseknél az első lépés gyakran az, hogy rendezzük az adatokat; így a rendstatisztikák előfordulása természetes dolog. Ebben a fejezetben az a célunk, hogy tanulmányozzuk a rendstatisztikák eloszlását a mintaeloszlásokkal kifejezve. Külön megemlítjük az extremális rendstatisztikákat, a minimumot és a maximumot:
A rendstatisztika kísérletben az alapértelmezett beállításokat használjuk és néhányszor elvégezzük a kísérletet. A következőket említjük meg:
Jelölje eloszlásfüggvényét. Legyen
Mutassuk meg, hogy binomiális eloszlású és paraméterekkel minden esetén!
Mutassuk meg, hogy akkor és csak akkor, ha esetén és -re!
Felhasználva a 2. és 3. gyakorlat eredményét mutassuk meg, hogy
Mutassuk meg, hogy !
Mutassuk meg, hogy !
Tételezzük fel, hogy folytonos eloszlású. Mutassuk meg, hogy folytonos eloszlású és sűrűségfüggvénye a következőképpen néz ki:
Útmutatás: Differenciáljuk a 4. gyakorlatban lévő kifejezést szerint.
A rendstatisztika kísérletben válasszunk a intervallumon egyenletes eloszlást és legyen . Változtassuk értékét 1-től 5-ig és figyeljük meg a sűrűségfüggvényének az alakját. Minden értékre végezzük el a szimulációt 1000-szer 10-esével frissítve. Az empirikus sűrűségfüggvény konvergenciája az elméleti sűrűségfüggvényhez nyilvánvalóan látszik.
Létezik egy heurisztikus bizonyítás a 7. gyakorlat eredményére. Először is annak a valószínűsége, hogy az -nak tetszőlegesen kicsi, sugarú környezetében van. Másrészt ez az esemény azt jelenti, hogy a mintaváltozók némelyike a végtelenül kicsi intervallumban helyezkedik el, mintaváltozó kisebb, mint , és mintaváltozó nagyobb, mint . Ezen változók lehetséges kiválasztásainak számát az alábbi multinomiális együttható adja meg:
A függetlenség miatt annak a valószínűsége, hogy a kiválasztott változók a megadott intervallumokba esnek:
Tekintsünk egy elemű véletlen mintát az exponenciális eloszlású paraméterű valószínűségi változóból. Számítsuk ki a -adik rendstatisztika sűrűségfüggvényét! Speciálisan megjegyezzük, hogy a változók minimuma (azaz ) exponenciális eloszlású paraméterrel.
A rendstatisztika kísérletben válasszuk az (1) exponenciális eloszlást és legyen . Változtassuk értékét 1-től 5-ig és figyeljük meg a sűrűségfüggvényének az alakját. Minden értékre végezzük el a szimulációt 1000-szer 10-esével frissítve. Az empirikus sűrűségfüggvény konvergenciája az elméleti sűrűségfüggvényhez nyilvánvalóan látszik.
Vizsgáljuk az elemű intervallumban egyenletes eloszlású véletlen mintát
A rendstatisztikai kísérletben válasszuk a intervallumban az egyenletes eloszlást és legyen . Változtassuk értékét 1-től 6-ig és figyeljük meg az átlag/standard szórás helyét és méretét. Minden értékre végezzük el a szimulációt 1000-szer 10-esével frissítve. Az empirikus momentumok konvergenciája az elméleti momentumokhoz nyilvánvalóan látszanak.
A dobókockakísérletben válasszuk a következő rendstatisztikát és kockaeloszlást. A kockák számát növeljük 1-től 20-ig, figyeljük meg mindegyik esetben a sűrűségfüggvény alakját. esetére végezzük el a szimulációt 1000-szer 10-esével frissítve. A relatív gyakoriság függvény konvergenciája a sűrűségfüggvényhez nyilvánvalóan látszik.
Tételezzük fel újra, hogy folytonos eloszlású.
Tegyük fel, hogy . Használjunk egy heurisztikus bizonyítást annak megmutatására, hogy az együttes sűrűségfüggvénye
Hasonló bizonyítást használhatunk ahhoz, hogy tetszőleges számú rendstatisztika együttes sűrűségfüggvényét megkapjuk. Természetesen, mi elsősorban a rendstatisztikák összességének együttes sűrűségfüggvényének megadásában vagyunk érdekelve; a következő gyakorlat ezt az együttes sűrűségfüggvényt adja meg, amely rendkívül egyszerű alakú.
Mutassuk meg, hogy együttes sűrűségfüggvénye a következő
Létezik egy egyszerű, heurisztikus bizonyítás a 16. Gyakorlat formulájára. Minden esetén, amennyiben létezik koordinátáinak darab permutációja. sűrűségfüggvénye ezen pontok mindegyikében . Ezért sűrűségfüggvénye pontban egy -szor ez a szorzat.
Vizsgáljunk egy elemű, paraméterű exponenciális elsozlásból vett mintát. Számítsuk ki az rendstatisztikák együttes sűrűségfüggvényét!
Tételezzük fel, hogy egy elemű intervallumban egyenletes eloszlású véletlen minta, ahol . Mutassuk meg, hogy
Néhány, a rendstatisztikákon alapuló fontos statisztikát tárgyalunk.
A minta terjedelme az
véletlen változó.Ez a statisztika a minta szóródásának egyszerű mértékét adja. Megjegyezzük, hogy a minta terjedelmének eloszlása a korábban megadott együttes eloszlásából kapható meg.
Vizsgáljuk az elemű, paraméterű exponenciális eloszlásból vett mintát. Mutassuk meg, hogy a minta terjedelme ugyanolyan eloszlású, mint az elemű, exponenciális eloszlásból vett véletlen minta maximumának eloszlása!
Vizsgáljuk az elemű, -ben egyenletes eloszlású véletlen mintát.
Ha páratlan, akkor a minta mediánja rendezett megfigyelések középső tagja, azaz
Ha páros, akkor nem egy középső elem van, hanem kettő. Igy a medián alatt az alábbit értjük:
Ebben az esetben a minta mediánja az intervallum középső pontja.
Bizonyos értelemben ez a definíció egy kicsit önkényes, mivel semmi kényszerű indok nincs arra vonatkozólag, hogy a medián intervallum melyik pontját válasszuk. Erre vonatkozólag a hiba függvények elemzésére utalunk a szórásnégyzetről szóló fejezetben. Végül is a minta mediánja egy természetes statisztika, amely megfelel a eloszlás mediánjának. Továbbá a minta mediánjának az eloszlását megkaphatjuk a rendstatisztikák eredményeiből.
Képesek vagyunk általánosítani a fentebb elemzett minta mediánját egyéb mintakvantilisre. Tételezzük fel, hogy . Legyen , az egész része és legyen az tört része. Felhasználva a lineáris interpolációt, definiáljuk a -ed rendű mintakvantilist a következőképpen:
Még egyszer, a -ed rendű mintakvantilis egy természetes statisztika, azaz hasonló a -ed rendű eloszláskvantilishez. Továbbá a mintakvantilis eloszlását megkaphatjuk a rendstatisztikák eredményeiből.
Az rendű mintakvantilis első mintakvartilis néven ismert, és gyakran -gyel jelöljük. A rendű mintakvantilis harmadik mintakvartilis néven ismert és -mal jelöljük. Megjegyezzük, hogy a minta mediánja rendű kvartilis és néha -vel jelöljük. Az interkvartilis tartomány definíciója:
Az IQR egy statisztika, ami a medián körüli eloszlás kiterjedését méri, de természetesen kevesebb információt ad, mint a intervallum.
Az alábbi öt statisztikára gyakran hivatkozunk, mint öt fontos statisztika. Ezek a statisztikák együtt, jó sok információt adnak az eloszlásról, az eloszlás középpontjára, kiterjedésére és ferdeségére vonatkozóan. Az öt számot gyakran boxplot segítségével ábrázoljuk, s amelyik az az minimumtól az maximumig húzott egyenesből áll, rajta egy téglalappal a első kvartilistől a harmadik kvartilisig, bejelölve a minimumot, a mediánt és a maximumot.
Az interaktív hisztogramon válasszuk a boxplotot. Konstruáljuk meg a 6 osztályból és legalább 10 értékből álló gyakorisági eloszlást. Számítsuk ki az öt fontos statisztikát és ellenőrizzük, hogy ugyanazt az eredményt kapjuk-e, mint az appletben!
Az interaktív hisztogramon válasszuk a boxplotot. Létesítsünk egy 0.1 szélességű osztályt és konstruáljunk az alább megadott típusok mindegyikéből legalább 30 értékből álló eloszlást. Majd növeljük az osztályszélességet a másik négy statisztika vizsgálatához. Hajtsa végre az oprációkat és figyelje meg a boxplot alakját és az öt fontos statisztika relatív helyzetét:
Az interaktív hisztogramnál válasszuk a boxplotot. Induljunk ki egy eloszlásból és válasszunk néhány további pontot az alábbiak szerint:
Az utolsó problémában megjegyezheti, hogy amikor az eloszláshoz hozzáveszünk egy pontot, akkor az öt statisztikából egy, vagy több nem változik. Általában a kvantilisek viszonylagosan érzéktelenek az adatok változására.
Számítsuk ki az öt fő statisztikai mutatószámot és vázoljuk a boxplotot a fénysebesség változóra a
Michelson féle adathalmazban! Hasonlítsuk össze a mediánt a fénysebesség valódi érték
ével!
Számítsuk ki az öt fő statisztikai mutatószámot és vázoljuk a boxplotot a földsűrűség változóra a
Cavendish féle adathalmazban! Hasonlítsuk össze a mediánt a föld sűrűségének valódi értéké
vel!
Számítsuk ki az öt fő statisztikai mutatószámot és vázoljuk a boxplotot az M&M adathalmaz súlyváltozójára!
Számítsuk ki az öt fő statisztikai mutatószámot és vázoljuk a boxplotot a Fisher féle nőszirom adathalmazra az alábbiaknak megfelelően! Ábrázoljuk a boxplotokat párhuzamos tengelyeken, így össze tudja hasonlítani őket!