]> Várható érték és kovariancia mátrixok
  1. Virtual Laboratories
  2. 3. Várható érték
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8. 6

6. Várható érték és kovariancia mátrixok

Ebben a fejezetben véletlen vektorok és mátrixok várható értékét és kovarianciáját tárgyaljuk. Ezek fontosak a többváltozós statisztikai eljárásokban és a többdimenziós normális eloszlás vizsgálatánál. A fejezet megértéséhez szükséges némi alapszintű lineáris algebrai ismeretanyag.

Általános elmélet

Jelölje m n az összes m n méretű, valós elemű mátrixok terét. Azonosítsuk n -et n 1 -el, azaz egy rendezett szám n -esre úgy gondolunk, mint egy n 1 méretű "oszlopvektorra". Az A mátrix transzponáltját jelölje A . Mint általában, tekintsünk egy eseménytéren egy véletlen kísérletet és egy valószínűségi mértéket.

Véletlen mátrixok várható értéke

Legyen X egy valós értékű valószínűségi változókból álló m n méretű mátrix, és az i j elemét jelölje X i j . Más szóval azt is mondhatjuk, hogy X egy m n méretű véletlen mátrix. Kézenfekvő módon definiáljuk X várható értékét: legyen az az m n méretű mátrix, melynek i j eleme épp X i j , azaz az X i j valószínűségi változó várható értéke.

Sok, a valós értékű valószínűségi változók várható értékére vonatkozó állítás megfelelője igaz véletlen mátrixok várható értékére is, csak az összefüggéseket mátrixműveletekkel kell felírni. Lássunk néhány példát!

Igazoljuk, hogy X Y X Y , ha X és Y m n méretű véletlen mátrixok.

Igazoljuk, hogy A X A X , ha A egy determinisztikus m n méretű mátrix , X pedig egy n k méretű véletlen mátrix.

Igazoljuk, hogy X Y X Y , ha X egy m n méretű, Y pedig egy n k méretű véletlen mátrix, továbbá X és Y függetlenek.

Kovariancia mátrixok

Legyen X egy m értékű, Y egy n értékű véletlen vektor. Ekkor X és Y kovariancia mátrixa az az m n méretű X Y mátrix, amelynek i j eleme X i Y j , azaz X i és Y j kovarianciája.

Igazoljuk, hogy X Y X X Y Y .

Igazoljuk, hogy X Y X Y X Y .

Igazoljuk, hogy Y X X Y .

Igazoljuk, hogy X Y 0 pontosan akkor, ha X minden eleme korrelálatlan Y minden elemével (ez speciálisan teljesül, ha X és Y függetlenek).

Igazoljuk, hogy X Y Z X Z Y Z , ha X és Y m -beli, Z pedig n -beli véletlen vektor.

Igazoljuk, hogy X Y Z X Y X Z , ha X m -beli, Y és Z pedig n -beli véletlen vektorok.

Igazoljuk, hogy A X Y A X Y , ha X m -beli véletlen vektor, Y n -beli véletlen vektor, és A egy k m -beli determinisztikus mátrix.

Igazoljuk, hogy X A Y X Y A ha X m -beli véletlen vektor, Y n -beli véletlen vektor, és A egy k n -beli determinisztikus mátrix.

Variancia-kovariancia mátrixok

Legyen most X X 1 X 2 X n egy n -beli véletlen vektor. Az X vektor önmagával vett kovariancia mátrixát X variancia-kovariancia mátrixának nevezik:

VC X X X .

Igazoljuk, hogy VC X szimmetrikus n n méretű mátrix, melynek diagonális elemei X 1 X 2 X n .

Igazoljuk, hogy VC X Y VC X X Y Y X VC Y , ha X és Y n értékű véletlen vektorok.

Igazoljuk, hogy VC A X A VC X A ha X n -beli véletlen vektor, A pedig egy m n -beli determinisztikus mátrix.

Vegyük észre, hogy ha a n , akkor a X nem más, mint az a és az X vektorok skaláris- vagy belső szorzata, és így X koordinátáinak lineáris kombinációja:

a X i 1 n a i X i > .

Igazoljuk, hogy a X a VC X a ha X n -beli véletlen vektor, és a n . Tehát VC X pozitív szemidefinit, így a sajátértékei nemnegatívak.

Igazoljuk, hogy VC X pontosan akkor pozitív szemidefinit, de nem pozitív definit, ha létezik a n és c , hogy majdnem biztosan

a X i 1 n a i X i c .

Tehát ha VC X pozitív szemidefinit, de nem pozitív definit, akkor X egyik koordinátáját a többi affin transzformáltjaként felírhatjuk, és így általában a modellünkből is száműzni tudjuk. Ezzel ellentétben, ha VC X pozitív definit, akkor ezt nem tehetjük meg: VC X összes sajátértéke (és így a determinánsa is) pozitív, tehát invertálható mátrix.

Legjobb lineáris becslők

Legyen ismét X X 1 X 2 X m m -beli véletlen vektor, Y Y 1 Y 2 Y n pedig n -beli véletlen vektor. Keressük X azon lineáris (azaz affin)

A X b ,  A n m ,  b n

függvényét, amely a legjobban közelíti Y -t olyan értelemben, hogy minimális az átlagos négyzetes hiba. Ez a kérdés rendkívül fontos a statisztikában, hisz előfordulhat, hogy X , az úgynevezett magyarázó változók vagy jósló változók vektora megfigyelhető, az Y vektor - melynek neve magyarázott változók vagy jósolt változók vektora - nem figyelhető meg. Ez az általánosítása az egy dimenziós esetnek, azaz, amikor X és Y valós értékű valószínűségi változók (ezt az esetet a kovariancia és korreláció fejezetben tárgyaltuk). Tegyük fel, hogy VC X pozitív definit, azaz X egyik eleme sem írható fel a többi elemének affin kombinációjaként.

Igazoljuk, hogy Y A X b 2 akkor minimális, ha A Y X VC X és b Y Y X VC X X .

Tehát Y -hoz Y következő lineáris függvénye van a legközelebb (azaz ennél minimális az átlagos négyzetes hiba):

L Y X Y Y X VC X X X .

Az

L Y X x Y Y X VC X x X

függvényt, mint x függvényét, nevezik lineáris regressziós függvénynek. Ha a megfigyelésünk szerint X x , akkor Y -t L Y X x -el becsüljük.

Az egy magyarázó változó esetén tekintett Nemlineáris regresszió feladatára gondolhatunk úgy, mint a többváltozós lineáris regresszió speciális esetére: legyen X magyarázó, Y magyarázott változó, g 1 g 2 g n pedig valós értékű függvények sorozata. A 17. feladat segítségével megtalálhatjuk g 1 X g 2 X g n X azon lineáris függvényét, amely a legközelebb van Y -hoz olyan értelemben, hogy minimális az átlagos négyzetes hiba: egyszerűen X i helyébe g i X -t írunk minden i -re.

Példák, alkalmazások

Legyen az X Y pár együttes sűrűségfüggvénye f x y x y ,  0 x 1 ,  0 y 1 . Határozzuk meg a következőket:

  1. X Y ,
  2. VC X Y .

Legyen az X Y pár együttes sűrűségfüggvénye f x y 2 x y ,  0 x y 1 . Határozzuk meg a következőket:

  1. X Y ,
  2. VC X Y .

Legyen az X Y pár együttes sűrűségfüggvénye f x y 6 x 2 y ,  0 x 1 ,  0 y 1 . Határozzuk meg a következőket:

  1. X Y ,
  2. VC X Y .

Legyen az X Y pár együttes sűrűségfüggvénye f x y 15 x 2 y ,  0 x y 1 . Határozzuk meg a következőket:

  1. X Y
  2. VC X Y ,
  3. L Y X ,
  4. L Y X X 2 .
  5. Ábrázoljuk a regressziós függvényeket közös koordináta rendszerben!

Legyen az X Y Z vektor egyenletes eloszlású a következő halmazon: x y z 3 0 x y z 1 Határozzuk meg a következőket:

  1. X Y Z ,
  2. VC X Y Z ,
  3. L Z X Y ,
  4. L Y X Z ,
  5. L X Y Z .

Legyen X egyenletes eloszlású a 0 1 intervallumon, és adott X esetén Y egyenletes eloszlású 0 X -en. Határozzuk meg a következőket:

  1. X Y ,
  2. VC X Y .