]>
Tételezzük fel, hogy van egy alap véletlen kísérletünk és hogy valamint valós értékű véletlen változó. Ennek megfelelően, egy véletlen vektor az térben. Felelevenítjük a várható értékek: és , a szórásnégyzetek: és valamint a kovariancia, tulajdonságait. Különösen emlékeztetünk a
korrelációra.Szükségünk lesz a kétváltozós magasabbrendű momentumra. Legyen
Tételezzük fel, hogy az alapkísérletet elvégezzük -szer. Ez a független, véletlen vektorok egy sorozatának összetett kísérletét eredményezi, melyek mindegyikének ugyanaz az eloszlása, mint az vektorváltozóé. Statisztikai értelemben ez egy elemű véletlen minta, mely az eloszlású. Szokás szerint -nel fogjuk jelölni az első koordináták sorozatát; ez egy elemű minta, mely az eloszlásából lett véve. Hasonlóan -nel fogjuk jelölni a második koordináták sorozatát; ez egy elemű minta, mely az eloszlásából lett véve.
Emlékeztetünk arra, hogy az minta átlagai és a szórásnégyzetei a következő módon vannak definiálva (és természetesen analóg definíciók érvényesek az -ra is):
Ebben a részben definiálni és tanulmányozni fogunk két statisztikát, amelyek az eloszlás kovarianciájának és korrelációjának természetes becslései. Ezek a statisztikák lesznek a síkon elhelyezkedő mintapontok lineáris kapcsolatának mértékei. Általában, a definíciók attól függenek, hogy a paraméterek ismertek, vagy ismeretlenek.
Tételezzük fel előszőr, hogy az és várható értékek ismertek. Ez természetesen, általában egy megalapozatlan feltevés, de mégis egy jó kiindulási pont az analízishez, s az eredmények, amiket kapunk egyszerűek és hasznosak lesznek. Ebben az esetben egy természetes becslése a következő:
Mutassuk meg, hogy egy eloszlású elemű véletlen minta mintabeli átlaga.
Az 1. gyakorlat eredményét felhasználva mutassuk meg, hogy
Speciálisan, egy torzítatlan és konzisztens becslése a kovarianciának.
A következő gyakorlat formulája konkrét számítások elvégzéséhez gyakran jobban hasznáható, mint a definíció.
Az szorzathoz definiált szorzat esetén mutassuk meg, hogy
A következő gyakorlatokban kimutatott tulajdonságok az eloszlás kovarianciájának tulajdonságainak felelnek meg.
Mutassuk meg, hogy
Mutassuk meg, hogy
Mutassuk meg, hogy ha konstans, akkor
Mutassuk meg, hogy
A következő gyakorlat egy formulát ad az összeg szórásnégyzetére. Az eredményt kiterjeszthetjük többtagú összegre is.
Mutassuk meg, hogy
Vizsgáljuk meg most azt a valóságosabb feltevést, hogy az és várható értékek ismeretlenek. Ebben az esetben az átlag természetes megközelítése: , ahol . Ha helyett bármilyen más konstanssal osztunk az átlagban, akkor is egy torzítatlan becslését kapjuk.
Értelmezze előjelét geometriailag, a pontoknak a szóródási diagram közepéhez viszonyított helyének megadásával.
Használjuk fel a kovariancia operátor bilinearitását annak megmutatására, hogy
.Fejtsük ki mindkét oldalt, majd az összegzést tagonként elvégezve mutassuk meg, hogy
A 10. és 11. gyakorlat eredményét és a várható érték alaptulajdonságait felhasználva mutassuk meg, hogy
Ezért -nak egy torzítatlan becslése a következő véletlen változó, amit mintakovarianciának nevezünk.
Amint a szórásnégyzetnél, amikor az mintaméret nagy, kicsi a különbség, ha nel, vagy -gyel osztunk.
A következő gyakorlat formulája konkrét számítások elvégzéséhez gyakran jobban használható, mint a definíció.
Az szorzatot használva, amit a 3. gyakorlatban definiáltunk, mutassuk meg, hogy
Az előző gyakorlat eredményét és a nagy számok erős törvényét használva mutassuk meg, hogy ha 1 valószínűséggel.
A következő gyakorlatokban kimutatott tulajdonságok az eloszlás kovarianciájának tulajdonságainak felelnek meg.
Mutassuk meg, hogy
Mutassuk meg, hogy
Mutassuk meg, hogy ha konstans, akkor
Mutassuk meg,
Mutassuk meg, hogy
A következő gyakorlat egy formulát ad az összeg szórásnégyzetére. Az eredményt kiterjeszthetjük többtagú összegre is.
Mutassuk meg, hogy
Ebben a részfejezetben a mintakovariancia szórásnégyzetére a következő formulát vezetjük le. A levezetés Ranjith Unnikrishnantól származik, és hasonló levezetés érvényes a mintavariancia szórásnégyzetére.
Ellenőrizzük a következő eredményt. Útmutatás: Induljunk ki a kifejezés jobb oldalából, fejtsük ki az alábbi szorzatot , és végezzük el az összegzést tagonként.
Következik, hogy a nem más, mint a 21. gyakorlat kifejtésében a kifejezések páronkénti kovarianciájának összege.
Most vezessük le a -ra a következő formulákat, megmutatva, hogy
Mutassuk meg, hogy . Ez ésszerűnek tűnik?
Mutassuk meg, hogy ha . Így a mintakovariancia konzisztens becslése az eloszlás kovarianciájának.
Az eloszlás korrelációval analóg módon, a minta korrelációja megkapható, mint a mintakovariancia és a mintaszórások hányadosa:
A nagy számok erős törvényét felhasználva mutassuk meg, hogy ha 1 valószínűséggel.
Kattintással definiáljunk 20 pontot az interaktív szórásdiagramon úgy, hogy minél jobban megközelítsük a következő értékeket: minta átlag 0, a minta standard szórása 1, a minta korrelációja az alábbiak szerint: 0, 0.5, −0.5, 0.7, −0.7, 0.9, −0.9.
Kattintással definiáljunk 20 pontot az interaktív szórásdiagramon úgy, hogy minél jobban megközelítsük a következő értékeket: mintaátlaga 1, mintaátlaga 3, az minta szórása 2, az minta szórása 1, a minta korrelációja az alábbiak szerint: 0, 0.5, −0.5, 0.7, −0.7, 0.9, −0.9.
Emlékeztetünk arra, hogy az (eloszlás) korreláció és regresszió fejezetben megmutattuk, hogy legjobb lineáris extrapolálása -en alapul, az átlagos négyzetes hiba minimalizálása alapján és pedig a következő véletlen változóval adható meg:
Emellett, az átlagos négyzetes hiba minimális értéke
Az eloszlás regressziós egyenese a következő módon adható meg:
Természetesen valós alkalmazásokban nem valószínű, hogy ismerjük az , , , és eloszlásparamétereket. Így, ebben a részben az -en alapuló legkisebb lineáris extrapoláltja érdekel minket, mely az véletlen mintából lett véve. Egy természetes megközelítés a mintapontokra legjobban illeszkedő egyenes megkeresése. Ez alapvető és fontos probléma a metematika számos területén, nem csak a statisztikában. A legjobb kifejezés azt jelenti, hogy meg akarjuk találni azt az egyenest (azaz azt az és értéket), amely minimalizálja az aktuális értékek és az előrejelzett értékek közötti átlagos négyzetes hibát:
Az és megtalálása, ami minimalizálja az MSE-t, az analízis egy standard problémája.
Mutassuk meg, hogy MSE akkor minimális, ha
s így a a minta regressziós egyenese
Felhasználva az előző gyakorlat együtthatóit, mutassuk meg, hogy az átlag négyzetes hibájának a minimuma:
Az előző gyakorlat eredményét felhasználva mutassuk meg, hogy
Így a mintakorreláció a mintapontok linearitásának fokát méri. Az előző gyakorlat eredményeit úgy is megkaphatjuk, ha észrevesszük, hogy a mintakorreláció az empirikus eloszlás korrelációjának egyszerűsítése. Természetesen (a), (b) és (c) ismertek, mint az eloszás korrrelációjának tulajdonságai.
Az a tény, hogy a 28. gyakorlat és a 29. gyakorlat eredményei a megfelelő eloszláseredmények mintabeli analogonjai szépek és megnyugtatóak. Megjegyezzük, hogy a minta regressziós egyenes átmegy az ponton, az empirikus eloszlás közepén. Természetesen, a minta regressziós egyenes együtthatói az elméleti eloszlás megfelelő együtthatóinak becsléseként jelennek meg.
Tételezzük fel, hogy a megfelelő magasabbrendű momentumok végesek, felhasználva a nagy számok törvényét mutassuk meg, hogy 1 valószínűséggel a minta regressziós egyenlet együtthatói konvergálnak az elméleti eloszlás regressziós egyenesének együtthatóihoz:
Ahogy az elméleti eloszlás regressziós egyenese, az előrejelzés és a függő változó megválasztása nagyon fontos.
Mutassuk meg, hogy az változó változóra vonatkozó minta regresziós egyenese és az változó változóra vonatkozó minta regresziós egyenese nem ugyanaz az egyenes , kivéve azt a triviális esetet, amikor a mintapontok egy egyenesen fekszenek.
Emlékeztetünk arra, hogy a konstans, ami az
kifejezést minimalizálja, az mintaátlag és az átlagos négyzetes eltérés minimális értéke az mintavariancia. Így az átlagos négyzetes eltérés értéke és a 29. gyakorlat eredménye közötti eltérés, nevezetesen az változkonyságában való csökkenés, amikor -ben a lineáris tagot hozzáadjuk a független változóhoz. Az részt és így ezt a statisztikát determinációs együtthatónak nevezzük.
Klikkeljünk az interaktív szórásdiagramon különböző helyekre és figyeljük a regressziós egyenes változását.
Klikkeljünk az interaktív szórásdiagram-ra, hogy 20 pontot definiáljunk. Próbáljuk meg úgy a generálást, hogy az átlaga 0 és az standard szórása 1 legyen, és a regressziós egyenes
Klikkeljünk az interaktív szórásdiagramra, hogy 20 pontot definiáljunk a következő tulajdonságokkal: az átlaga 1, átlaga 1 és a regressziós egyenes meredeksége 1, tengelymetszete 2 legyen.
Ha nehézsége volt az előző gyakorlattal, akkor az azért van, mert a feltételeket, amkiket megadott, lehetetlen teljesíteni!
Futtassuk le kétváltozós egyenletes kísérletet 2000-szer, 10-es gyakorisággal változtatva a következő esetek mindegyikében! A mintaátlagoknak az elméleti átlagokhoz, a minta standard szórásának az elméleti szóráshoz, a minta korrelációjának az elméleti korrelációhoz és a minta regressziós egyenesének az elméleti regressziós egyeneséhez való konvegenciája nyílvánvalónak látszik.
Futtassuk le kétváltozós normális kísérletet 2000-szer, 10-esével frissítve a következő esetek mindegyikében! A mintaátlagoknak az elméleti átlagokhoz, a minta standard szórásának az elméleti szóráshoz, a minta korrelációjának az elméleti korrelációhoz és a minta regressziós egyenesének az elméleti regressziós egyeneséhez való konvegenciája nyílvánvalónak látszik.
Számítsuk ki a sziromlevél hosszának és szélességének korrelációs együtthatóját a következő esetekre a Fisher féle nőszirom adatokra. Magyarázzuk meg a különbségeket.
Számítsuk ki a színpárok közötti korrelációt az M&M adatok esetén.
Vizsgáljuk az összes esetet a Fisher féle nőszirom adatokra.
Vizsgáljuk meg a csak Setosa eseteket a Fisher féle nőszirom adatokra.