Várható érték és kovariancia mátrixok

Ebben a fejezetben véletlen vektorok és mátrixok várható értékét és kovarianciáját tárgyaljuk. Ezek fontosak a többváltozós statisztikai eljárásokban és a többdimenziós normális eloszlás vizsgálatánál. A fejezet megértéséhez szükséges némi alapszintű lineáris algebrai ismeretanyag.

Általános elmélet

Jelölje

m n

az összes

m n

méretű, valós elemű mátrixok terét. Azonosítsuk

n

-et

n 1

-el, azaz egy rendezett szám

n

-esre úgy gondolunk, mint egy

n 1

méretű "oszlopvektorra". Az

A

mátrix transzponáltját jelölje

A

. Mint általában, tekintsünk egy eseménytéren egy véletlen kísérletet és egy

valószínűségi mértéket.

Véletlen mátrixok várható értéke

Legyen

X

egy valós értékű valószínűségi változókból álló

m n

méretű mátrix, és az

i j

elemét jelölje

X i j

. Más szóval azt is mondhatjuk, hogy

X

egy

m n

méretű véletlen mátrix. Kézenfekvő módon definiáljuk

X

várható értékét: legyen az az

m n

méretű mátrix, melynek

i j

eleme épp

X i j

, azaz az

X i j

valószínűségi változó várható értéke.

Sok, a valós értékű valószínűségi változók várható értékére vonatkozó állítás megfelelője igaz véletlen mátrixok várható értékére is, csak az összefüggéseket mátrixműveletekkel kell felírni. Lássunk néhány példát!

Igazoljuk, hogy $X Y X Y$ , ha $X$ és $Y$ $m n$ méretű véletlen mátrixok.

Igazoljuk, hogy $A X A X$ , ha $A$ egy determinisztikus $m n$ méretű mátrix , $X$ pedig egy $n k$ méretű véletlen mátrix.

Igazoljuk, hogy $X Y X Y$ , ha $X$ egy $m n$ méretű, $Y$ pedig egy $n k$ méretű véletlen mátrix, továbbá $X$ és $Y$ függetlenek.

Kovariancia mátrixok

Legyen

X

egy

m

értékű,

Y

egy

n

értékű véletlen vektor. Ekkor

X

és

Y

kovariancia mátrixa az az

m n

méretű

X Y

mátrix, amelynek

i j

eleme

X i Y j

, azaz

X i

és

Y j

kovarianciája.

Igazoljuk, hogy $X Y X X Y Y$ .

Igazoljuk, hogy $X Y X Y X Y .$

Igazoljuk, hogy $Y X X Y .$

Igazoljuk, hogy $X Y 0$ pontosan akkor, ha $X$ minden eleme korrelálatlan $Y$ minden elemével (ez speciálisan teljesül, ha $X$ és $Y$ függetlenek).

Igazoljuk, hogy $X Y Z X Z Y Z$ , ha $X$ és $Y$ $m$ -beli, $Z$ pedig $n$ -beli véletlen vektor.

Igazoljuk, hogy $X Y Z X Y X Z$ , ha $X$ $m$ -beli, $Y$ és $Z$ pedig $n$ -beli véletlen vektorok.

Igazoljuk, hogy $A X Y A X Y$ , ha $X$ $m$ -beli véletlen vektor, $Y$ $n$ -beli véletlen vektor, és $A$ egy $k m$ -beli determinisztikus mátrix.

Igazoljuk, hogy $X A Y X Y A$ ha $X$ $m$ -beli véletlen vektor, $Y$ $n$ -beli véletlen vektor, és $A$ egy $k n$ -beli determinisztikus mátrix.

Variancia-kovariancia mátrixok

Legyen most

X X 1 X 2 X n

egy

n

-beli véletlen vektor. Az

X

vektor önmagával vett kovariancia mátrixát

X

variancia-kovariancia mátrixának nevezik:

Igazoljuk, hogy $VC X$ szimmetrikus $n n$ méretű mátrix, melynek diagonális elemei $X 1 X 2 X n$ .

Igazoljuk, hogy $VC X Y VC X X Y Y X VC Y$ , ha $X$ és $Y$ $n$ értékű véletlen vektorok.

Igazoljuk, hogy $VC A X A VC X A$ ha $X$ $n$ -beli véletlen vektor, $A$ pedig egy $m n$ -beli determinisztikus mátrix.

Vegyük észre, hogy ha

a n

, akkor

a X

nem más, mint az

a

és az

X

vektorok skaláris- vagy belső szorzata, és így

X

koordinátáinak lineáris kombinációja:

Igazoljuk, hogy $a X a VC X a$ ha $X$ $n$ -beli véletlen vektor, és $a n$ . Tehát $VC X$ pozitív szemidefinit, így a sajátértékei nemnegatívak.

Igazoljuk, hogy $VC X$ pontosan akkor pozitív szemidefinit, de nem pozitív definit, ha létezik $a n$ és $c$ , hogy majdnem biztosan

a X i 1 n a i X i c .

Tehát ha

VC X

pozitív szemidefinit, de nem pozitív definit, akkor

X

egyik koordinátáját a többi affin transzformáltjaként felírhatjuk, és így általában a modellünkből is száműzni tudjuk. Ezzel ellentétben, ha

VC X

pozitív definit, akkor ezt nem tehetjük meg:

VC X

összes sajátértéke (és így a determinánsa is) pozitív, tehát invertálható mátrix.

Legjobb lineáris becslők

Legyen ismét

X X 1 X 2 X m

m

-beli véletlen vektor,

Y Y 1 Y 2 Y n

pedig

n

-beli véletlen vektor. Keressük

X

azon lineáris (azaz affin)

függvényét, amely a legjobban közelíti

Y

-t olyan értelemben, hogy minimális az átlagos négyzetes hiba. Ez a kérdés rendkívül fontos a statisztikában, hisz előfordulhat, hogy

X

, az úgynevezett magyarázó változók vagy jósló változók vektora megfigyelhető, az

Y

vektor - melynek neve magyarázott változók vagy jósolt változók vektora - nem figyelhető meg. Ez az általánosítása az egy dimenziós esetnek, azaz, amikor

X

és

Y

valós értékű valószínűségi változók (ezt az esetet a kovariancia és korreláció fejezetben tárgyaltuk). Tegyük fel, hogy

VC X

pozitív definit, azaz

X

egyik eleme sem írható fel a többi elemének affin kombinációjaként.

Igazoljuk, hogy $Y A X b 2$ akkor minimális, ha $A Y X VC X$ és $b Y Y X VC X X$ .

Tehát

Y

-hoz

Y

következő lineáris függvénye van a legközelebb (azaz ennél minimális az átlagos négyzetes hiba):

függvényt, mint

x

függvényét, nevezik lineáris regressziós függvénynek. Ha a megfigyelésünk szerint

X x

, akkor

Y

-t

L Y X x

-el becsüljük.

Az egy magyarázó változó esetén tekintett Nemlineáris regresszió feladatára gondolhatunk úgy, mint a többváltozós lineáris regresszió speciális esetére: legyen

X

magyarázó,

Y

magyarázott változó,

g 1 g 2 g n

pedig valós értékű függvények sorozata. A 17. feladat segítségével megtalálhatjuk

g 1 X g 2 X g n X

azon lineáris függvényét, amely a legközelebb van

Y

-hoz olyan értelemben, hogy minimális az átlagos négyzetes hiba: egyszerűen

X i

helyébe

g i X

-t írunk minden

i

-re.

Példák, alkalmazások

Legyen az $X Y$ pár együttes sűrűségfüggvénye $f x y x y, 0 x 1, 0 y 1$ . Határozzuk meg a következőket:

$X Y,$
$VC X Y .$

Legyen az $X Y$ pár együttes sűrűségfüggvénye $f x y 2 x y, 0 x y 1$ . Határozzuk meg a következőket:

$X Y,$
$VC X Y .$

Legyen az $X Y$ pár együttes sűrűségfüggvénye $f x y 6 x 2 y, 0 x 1, 0 y 1$ . Határozzuk meg a következőket:

$X Y,$
$VC X Y .$

Legyen az $X Y$ pár együttes sűrűségfüggvénye $f x y 15 x 2 y, 0 x y 1$ . Határozzuk meg a következőket:

$X Y$
$VC X Y,$
$L Y X,$
$L Y X X 2 .$
Ábrázoljuk a regressziós függvényeket közös koordináta rendszerben!

Legyen az $X Y Z$ vektor egyenletes eloszlású a következő halmazon: $x y z 3 0 x y z 1$ Határozzuk meg a következőket:

$X Y Z,$
$VC X Y Z,$
$L Z X Y,$
$L Y X Z,$
$L X Y Z .$

Legyen $X$ egyenletes eloszlású a $01$ intervallumon, és adott $X$ esetén $Y$ egyenletes eloszlású $0 X$ -en. Határozzuk meg a következőket:

$X Y,$
$VC X Y .$

6. Várható érték és kovariancia mátrixok