Feltételes valószínűség

Kiindulási pontunk, mint általában, most is egy véletlen kísérlet egy

S

eseménytéren, és egy

valószínűségi mérték. Tegyük fel, hogy tudjuk, hogy a

B

esemény bekövetkezett. Ez természetesen általában befolyásolja a többi esemény valószínűségét. Ha például

A

egy másik esemény, akkor

A

pontosan akkor következik be, ha

A

és

B

is bekövetkezik. Tehát lényegében az eseményteret

B

-re redukáltuk. Tehát

A

valószínűsége amellett a feltétel mellett, hogy

B

bekövetkezett,

A B

-vel kell, hogy arányos legyen.

Természetesen a

B

bekövetkezése esetén vett feltételes valószínűségnek is valószínűségi mértéknek kell lennie, azaz teljesítenie kell a valószínűségi mértékek axiómáit. Tehát az előző aránynál a konstansnak

1 B

-nek kell lennie. Így a definíciónk nem lehet más, mint a következő:

legyenek

A

és

B

egy véletlen kísérlettől függő események, továbbá

B 0

. Ekkor az

A

esemény

B

-re vonatkoztatott feltételes valószínűsége

A nagy számok törvénye

Az előző definíciót a valószínűségszámítás axiómáinak segítségével adtuk meg. Tekintsünk most ehelyett egy másik, kevésbé precíz, de intuitívabb megközelítést a relatív gyakoriságok, és a nagy számok törvénye fogalmain keresztül. Tehát tekintsünk egy kísérletet, amelyet többször, egymástól függetlenül megismételtünk. Egy tetszőleges

C

eseményre legyen

N n C

azon kísérletek száma az első

n

kísérlet között, amelyekben

C

bekövetkezett. Vegyük észre, hogy ekkor

N n C

egy valószínűségi változó abban az összetett kísérletben, amely az eredeti kísérlet néhányszori ismétléséből áll.

N n B

nagy, akkor az

A

esemény

B

melletti feltételes valószínűsége közel kell, hogy essen az

A

esemény

B

-re vonatkozó feltételes relatív gyakoriságához, azaz az

A

esemény relatív gyakoriságához az olyan kísérletek között, amikor

B

bekövetkezett:

De mivel

N n A B N n B N n A B n N n B n,

ezért a nagy számok törvénye miatt

Néha a feltételes valószínűséget egyszerűen meghatározhatjuk úgy, hogy lecsökkentjük az eseményteret, máskor azonban a fenti képletet kell használnunk.

Feltételes eloszlások

Tegyük fel, hogy

X

egy

T

értékű valószínűségi változó. Ekkor az

X

változó (valószínűség-) eloszlása egy valószínűségi mérték

T

-n, melyre

B

egy esemény (azaz

S

egy részhalmaza), melynek a mértéke nem nulla, akkor az

X

változó

B

esemény melletti feltételes eloszlása egy valószínűségi mérték

T

-n, melyre

Alaptulajdonságok

Igazoljuk, hogy fix $B$ esetén $A A B$ egy valószínűségi mérték.

Az 1. feladat a feltételes valószínűség legfontosabb tulajdonsága, hisz emiatt minden állítás, amely igaz valószínűségi mértékekre, speciálisan igaz feltételes valószínűségi mértékekre is, amennyiben a feltétel rögzített. Így például a Valószínűségi mértékekről szóló előző fejezet 6-20. feladataival analóg állítások is igazak feltételes valószínűségekre.

Legyenek $A$ és $B$ egy véletlen kísérlettől függő események, és $B 0$ . Igazoljuk az alábbiakat:

Ha $B A$ , akkor $A B 1$ .
Ha $A B$ , akkor $A B A B$ .
Ha $A$ és $B$ diszjunktak, akkor $A B 0 .$

Korreláció

Legyenek $A$ és $B$ pozitív valószínűségű események. Igazoljuk, hogy

$A B A$ pontosan akkor, ha $B A B$ ; és ez pontosan akkor következik be, ha $A B A B .$
$A B A$ pontosan akkor, ha $B A B$ ; és ez pontosan akkor következik be, ha $A B A B .$
$A B A$ pontosan akkor, ha $B A B$ ; és ez pontosan akkor következik be, ha $A B A B .$

Az (a) esetben azt mondjuk, hogy

A

és

B

pozitívan korreláltak. Azaz szemléletesen az egyik esemény bekövetkezése megnöveli a másik esemény bekövetkezésének valószínűségét. A (b) esetben azt mondjuk, hogy

A

és

B

negatívan korreláltak. Azaz szemléletesen az egyik esemény bekövetkezése csökkenti a másik esemény bekövetkezésének valószínűségét. A (c) esetben azt mondjuk, hogy

A

és

B

korrelálatlanok vagy függetlenek. Azaz szemléletesen az egyik esemény bekövetkezése nem befolyásolja a másik esemény bekövetkezésének valószínűségét. A függetlenség egy alapvető fontosságú fogalom, amely kiterjeszthető kettőnél több eseményre, és valószínűségi változóra is. Ezt részletesebben az ezután következő Függetlenség című fejezetben tárgyaljuk. A valószínűségi változók korrelációjáról pedig a Várható érték fejezet Kovariancia és korreláció című részében olvashatunk.

A szorzási szabály

Néha előfordul, hogy egy feladatban feltételes valószínűségeket ismerünk, és ezek segítségével akarunk egyéb valószínűségeket meghatározni.

Legyen $A 1 A 2 A n$ olyan véletlen események sorozata, amelyek metszete nem üres, Igazoljuk a valószínűségek szorzási szabályát:

A 1 A 2 A n A 1 A 2 A 1 A 3 A 1 A 2 A n A 1 A 2 A n 1 .

Segítség: Használjuk a definíciót a jobb oldalon megjelenő összes feltételes valószínűségnél. Sok tag ki fog esni a szorzatból, egyedül az a tag marad benn, amelyben mind az $n$ esemény szerepel.

Az előző szorzási szabály különösen hasznos lehet az olyan összetett kísérletek esetén, ahol az egymást követő lépések kimenetelei függnek a korábbi lépések kimeneteitől (az előző jelöléssel

A i

i

-edik lépésben lezajló részkísérlet). Hasonlítsuk össze a valószínűségek szorzási szabályát a kombinatorika szorzási szabályával!

Feltételes valószínűség és Bayes tétel

Legyen

A A i i I

események megszámlálható családja, melyek az

S

eseményteret particionálják (az ilyen eseményeket szokás teljes eseményrendszernek nevezni), és legyen

B

egy tetszőleges esemény.

Igazoljuk a teljes valószínűség tételét:

B i I A i B A i .

Segítség: vegyük észre, hogy az összeg $i$ -edik tagja $A i B$ , és hogy $A i B i I$ $B$ -nek egy partíciója.

Igazoljuk a Thomas Bayes-ről elnevezett Bayes tételt:

A j B A j B A j i I A i B A i, j I .

Segítség: A számláló épp $A j B$ , míg a nevező az 5. feladat értelmében épp $B$ .

Természetesen az előző két tétel akkor hasznos, ha ismerjük

A i

és

B A i

értékeit minden

i I

-re. Ha

B

valószínűségét az 5. feladatban igazolt teljes valószínűség tételével számoljuk ki, akkor azt mondjuk, hogy az

A

partícióra feltételezünk (vagy kondicionálunk). A kiszámolt összegre úgy gondolhatunk, mint a

B A i

számok súlyozott átlaga, ahol

i I

, és

A i

i I

a súlyok. A 6. feladatban igazolt Bayes tételben pedig

A j

szokás az

A j

a priori valószínűségének nevezni, a

A j B

feltételes valószínűséget pedig a posteriori valószínűségnek. A feltételes valószínűség, és Bayes tétel témákról még fogunk tanulni az Eloszlások fejezet Diszkrét eloszlások részében, és a Várható érték fejezet Feltételes várható érték részében.

Példák, alkalmazások

Legyenek $A$ és $B$ egy kísérlettől függő események, és legyen $A 1 3$ , $B 1 4$ , $A B 1 10$ . Határozzuk meg a következő valószínűségeket:

$A B$
$B A$
$A B$
$B A$
$A B .$

Legyenek $A$ , $B$ és $C$ egy véletlen kísérlettől függő események, és legyen $A C 1 2$ , $B C 1 3$ és $A B C 1 4$ . Határozzuk meg a következő valószínűségeket:

$A B C$
$A B C$
$A B C .$

Legyenek $A$ és $B$ egy véletlen kísérlettől függő események, és legyen $A 1 2$ , $B 1 3$ és $A B 3 4$ .

Mennyi $A B$ ?
Mennyi $A B$ ?
Mennyi $B A$ ?
Mennyi $B A$ ?
Vajon az $A$ és $B$ események pozitívan korreláltak, negatívan korreláltak, vagy függetlenek?

Egy városban az emberek 30%-a dohányzik, és 8%-a beteg (valamilyen légzőszervi megbetegedésben). Tudjuk továbbá, hogy a dohányosok 12%-a beteg.

A lakosság hány százaléka dohányzik és beteg?
A betegek hány százaléka dohányzik?
A dohányzás és a betegség pozitívan korreláltak, negatívan korreláltak, vagy függetlenek?

Tegyük fel, hogy valamilyen munka elvégzéséhez $X$ véletlen időre van szükség, ahol $X$ eloszlása egyenletes az $1560$ intervallumon.

Mennyi annak a valószínűsége, hogy a munka elvégzéséhez több mint 30 percre van szükség?
Feltéve, hogy a munkát nem végezték el 30 perc alatt, mi annak a valószínűsége, hogy még további 15 perc alatt sem végzik el?
Határozzuk meg $X$ feltételes eloszlását amellett a feltétel mellett, hogy $X 30$ .

Kockák és érmék

Egy kísérlet abból áll, hogy feldobunk két hagyományos, igazságos kockát, és a dobott számokat feljegyezzük az $X X 1 X 2$ vektorba. Legyen $Y$ a dobott számok összege. Az alábbi eseménypárok mindegyikénél határozzuk meg mindkét esemény valószínűségét, mindkét eseménynek a másikra, mint feltételre vonatkoztatott feltételes valószínűségét, és döntsük el, hogy az adott események pozitívan korreláltak, negatívan korreláltak, vagy függetlenek!

$X 1 3$ , $Y 5$
$X 1 3$ , $Y 7$
$X 1 2$ , $Y 5$
$X 1 3$ , $X 1 2 .$

Vegyük észre, hogy a pozitívan korreláltság nem tranzitív reláció! Például az előző feladatban

X 1 3

és

Y 5

pozitívan korreláltak,

Y 5

és

X 1 2

szintén pozitívan korreláltak, de

X 1 3

és

X 1 2

negatívan korreláltak (sőt, diszjunktak!).

A kockadobás kísérletben állítsuk be az $n 2$ paraméterértéket! Szimuláljunk 500 kísérletet, és számítsuk ki az előző feladatban meghatározott feltételes valószínűségekhez tartozó relatív gyakoriságokat!

Tekintsük megint azt a kísérletet, amely abból áll, hogy feldobunk két hagyományos, igazságos kockát, és a dobott számokat feljegyezzük az $X X 1 X 2$ vektorba. Legyen $Y$ a dobott számok összege. Határozzuk meg az $X$ vektor feltételes eloszlását amellett a feltétel mellett, hogy $Y 7$ .

A kocka- és érmedobás kísérletében először feldobunk egy szabályos, igazságos kockát, majd feldobunk annyi pénzérmét, amennyit a kockánk mutat.

Mennyi annak a valószínűsége, hogy minden érménk fejet mutat?
Tegyük fel, hogy minden érménk fejet mutat. Ekkor mi a valószínűsége, hogy a kockával az $i$ számot dobtuk ( $i 123456$ )?

Szimuláljunk 200 darab kocka-, és érmedobás kísérletet!

Határozzuk meg a relatív gyakoriságát annak az eseménynek, hogy minden érme fejet mutat, és hasonlítsuk ezt össze az előzőekben kiszámított valószínűséggel!
Minden $i 123456$ számra határozzuk meg az empirikus feltételes valószínűségét annak az eseménynek, hogy a kockával az $i$ számot dobtuk, feltéve, hogy minden érme fejet mutat. Hasonlítsuk össze a kapott értékeket az előző feladatban meghatározott elméleti valószínűségekkel!

Tegyük fel, hogy egy zsákban 12 érme van: 5 igazságos, 4 olyan hamis érme, ahol a fejdobás valószínűsége $1 3$ ; és 3 érme mindkét oldala fej. Kiválasztunk véletlenszerűen egy érmét a zsákból, és azt feldobjuk.

Mi a valószínűsége annak, hogy fejet dobunk?
Feltéve, hogy fejet dobtunk, mi a valószínűsége annak, hogy igazságos/hamis/kétfejű érmét dobtunk?

Hasonlítsuk most össze a 15. feladatot és a 17. feladatot! A 15. feladatban az függ a véletlentől, hogy hányszor dobunk fel egy érmét, míg a fejdobás valószínűsége determinisztikus. A 17. feladat viszont felfogható úgy, hogy a dobások száma determinisztikus, míg a fejdobás valószínűsége függ a véletlentől. Azt a kísérletet, amelyben

n

-szer dobunk fel egy olyan érmét, amelyben a fejdobás valószínűsége

p

(tehát mindkét paraméter determinisztikus),

n

és

p

paraméterű binomiális kísérletnek nevezzük. Ez egy nagyon fontos kísérlet, melyről részletesebben a Bernoulli kísérletek fejezet binomiális eloszlás című részében olvashatunk. Tehát a 15. és a 17. feladat a binomiális kísérlet olyan módosításai, melyekben az egyik paramétert véletlenítettük. Általában is igaz, hogy sok érdekes, új kísérlet gyártható oly módon, hogy egy hagyományos kísérlet néhány paraméterét a véletlentől teszünk függővé.

Az érme- és kockadobás kísérletében először feldobunk egy szabályos érmét, majd ha ez írást mutat egy igazságos kockát dobunk fel, ha pedig fejet mutat, egy egy-hat irányban lapos kockát dobunk fel. Ez utóbbi az 1 és 6 értékeket $1 4$ , a 2,3,4 és 5 értékeket $1 8$ valószínűséggel mutatja.

Mennyi annak a valószínűsége, hogy a kockával az $i$ számot dobjuk ( $i 123456$ )?
Feltéve, hogy a kockával négyest dobtunk, mi a valószínűsége, hogy az érmével fejet/írást dobtunk?

Szimuláljunk 500 darab érme- és kockadobás kísérletet az előző feladat paramétereivel!

Határozzuk meg annak az eseménynek a relatív gyakoriságát, hogy a kockával az $i$ számot dobtuk, minden lehetséges $i$ -re, és vessük ezeket össze az előző feladatban kiszámított valódi valószínűségekkel!
Számítsuk ki annak az eseménynek a feltételes relatív gyakoriságát, hogy az érmével fejet dobtunk, feltéve, hogy a kockával négyest dobtunk! Hasonlítsuk ezt össze az előző feladatban kiszámolt valódi valószínűséggel!

Kártyák

Tekintsük azt a kártya kísérletet, amelyben 2 kártyát választunk ki egy pakliból. $i 12$ -re legyen $Q i$ az az esemény, hogy az $i$ -edik kártya dáma, $H i$ pedig az az esemény, hogy az $i$ -edik kártya kőr. Az alábbi eseménypárok mindegyikénél határozzuk meg mindkét esemény valószínűségét, mindkét eseménynek a másikra, mint feltételre vonatkoztatott feltételes valószínűségét, és döntsük el, hogy az adott események pozitívan korreláltak, negatívan korreláltak, vagy függetlenek!

$Q 1, H 1$
$Q 1, Q 2$
$Q 2, H 2$
$Q 1, H 2 .$

A kártya kísérlet szimulációjában állítsuk be az $n 2$ paraméterértéket! Szimuláljunk 500 kísérletet, s számítsuk ki az előző feladatban meghatározott feltételes valószínűségekhez tartozó empirikus feltételes valószínűségeket!

Tekintsük a kártya kísérletet most $n 3$ kártyával. Határozzuk meg az alábbi események valószínűségét!

Mind a három kártya kőr.
Az első két kártya kőr, a harmadik pikk.
Az első és a harmadik kártya kőr, a második pikk.

A kártya kísérlet szimulációjában állítsuk be az $n 3$ paraméterértéket! Számítsuk ki az előző feladatban szereplő események relatív gyakoriságát, és vessük azokat össze a valódi valószínűségekkel!

Buffon féle érmedobás kísérlet

A Buffon féle érmedobás kísérletben egy $r 1 2$ sugarú érmét véletlenszerűen feldobunk egy olyan padló felett, melyet 1 egység oldalhosszúságú négyzet alakú csempékkel raktunk ki. Miután az érme földet ér, a középpontjának koordinátáit az $X Y$ vektorba feljegyezzük, ahol az origó annak a csempének a középpontja, amelyikre az érmeközéppont esik, a koordinátatengelyek pedig párhuzamosak a csemperács éleivel.

Mennyi $Y 0 X Y$ ?
Határozzuk meg $X Y$ feltételes eloszlását amellett a feltétel mellett, hogy az érme csak egy csempéhez ér hozzá!

Szimuláljunk 500 darab Buffon féle érmedobás kísérletet, és határozzuk meg az $Y 0$ esemény empirikus feltételes valószínűségét amellett a feltétel mellett, hogy $X Y$ , majd az eredményt vessük össze az előző feladatban kiszámolt pontos valószínűséggel!

Adathalmaz elemzések

Az M&M adathalmazban határozzuk meg annak az eseménynek az empirikus feltételes valószínűségét, hogy egy zacskóban legalább 10 piros cukorka van, feltéve, hogy a zacskó tömege legalább 48 gramm!

Nyissuk meg a Kabóca adathalmazt!

Feltéve, hogy a kabóca hím, mennyi annak a relatív gyakorisága, hogy a tömege legalább 0,25 gramm?
Feltéve, hogy a kabóca alfaja tredecula, mennyi annak a relatív gyakorisága, hogy a tömege legalább 0,25 gramm?

Megbízhatóság

Egy gyárban 3 különböző technológiával állítanak elő memóriakártyákat. Az első technológiával gyártják a memóriakártyák 50%-át, az esetek 4%-ában selejtesen. A második technológiával a memóriakártyák 30%-át állítják elő, és az eljárás az esetek 5%-ában selejtes terméket gyárt. Végül a harmadik technológiát használják az esetek 20%-ában, és itt minden századik termék selejtes. Véletlenszerűen kiválasztunk egy memóriakártyát.

Mennyi annak a valószínűsége, hogy a memóriakártya selejtes?
Feltéve, hogy a memóriakártya selejtes, mi annak a valószínűsége, hogy az első/második/harmadik technológiával gyártották?

Genetika

A következő feladatban tegyük fel, hogy a szóban forgó borsó hüvelyének színe zöld, vagy sárga lehet, és a zöld színt hordozó gén domináns. Azaz a

z z

és a

z s

genotipusú borsó zöld lesz, a

s s

genotipusú pedig sárga.

Egymás mellett nevelünk két borsó palántát, az egyik zöld, a másik sárga hüvelyű. Tudjuk továbbá, hogy a zöld növény $1 4$ valószínűséggel hordozza a sárga színt okozó gént.

Menyi annak a valószínűsége, hogy az utódnövény hüvelyszíne zöld lesz?
Tegyük fel, hogy az utód zöld hüvelyű. Emellett mi a feltételes valószínűsége annak, hogy az eredeti zöld hüvelyű borsónk hordozza a recesszív gént?

Egymás mellett nevelünk két zöldhüvelyű borsó palántát. Tegyük fel, hogy $1 3$ valószínűséggel egyik növényünk sem hordozza a recesszív gént, továbbá $1 2$ valószínűséggel pontosan az egyik, $1 6$ valószínűséggel pedig mindkét növényünk hordozza a recesszív gént.

Menyi annak a valószínűsége, hogy az utódnövény hüvelyszíne zöld lesz?
Tegyük fel, hogy az utód zöld hüvelyű. Emellett mi a feltételes valószínűsége annak, hogy eredetileg mindkét növény hordozta a recesszív gént?

Mint már korábban is tárgyaltuk, a nemtől függő öröklődő emberi rendellenességet az X kromoszómák hibája okozza. Jelölje

n

a normális, egyben domináns gént,

d

pedig a rendellenességet okozó gént. Így egy

n n

genotipusú nő egészséges, egy

n d

genotipusú nő szintén tünetmentes, de hordozza a rendellenességet, egy

d d

genotipusú nő pedig beteg. Egy

n

genotipusú férfi egészséges, egy

d

genotipusú pedig beteg. A dikromácia nevű rendellenesség (ami a színvakság egy fajtája) ilyen tipusú betegség, ezért gyakoribb a férfiaknál.

Tegyük fel, hogy egy adott populáció fele férfi, fele nő. Továbbá a férfiak 10%-a színtévesztő, még a nőknél ez az arány csak 1%.

Az emberek hány százaléka színtévesztő?
A színtévesztők hány százaléka férfi?

Tegyük fel, hogy egy házaspár mindkét tagja egészséges, azonban a nő $1 3$ valószínűséggel hordozza a színtévesztést okozó gént.

Mennyi a valószínűsége, hogy a fiuk egészséges lesz?
Mennyi a valószínűsége, hogy a lányuk hordozni fogja a rendellenességet okozó gént?
Tegyük fel, hogy a házaspár elsőszülött fia egészséges. Mennyi a feltételes valószínűsége annak, hogy az édesanyja hordozza a rendellenességet okozó gént?

Urna Modellek

Az első urnánkban 4 piros és 6 zöld golyó van, míg a másodikban 7 piros és 3 zöld. Véletlenszerűen kiválasztunk egy urnát, majd abból egy golyót.

Mennyi a valószínűsége annak, hogy zöld golyót választottunk?
Feltéve, hogy zöld golyót választottunk, mi a valószínűsége annak, hogy azt az első urnából húztuk ki?

Az első urnánkban 4 piros és 6 zöld golyó van, míg a másodikban 6 piros és 3 zöld. Kihúzunk egy golyót az első urnából, és azt áttesszük a másodikba. Ezután kihúzunk egy golyót a második urnából is.

Mennyi a valószínűsége, hogy másodszorra zöld golyót húztunk?
Feltéve, hogy másodszorra zöld golyót húztunk, mennyi a valószínűsége, hogy az első urnából húzott golyó is zöld volt?

Egy urnában eredetileg $a$ darab piros, és $b$ darab zöld golyó van ( $a$ és $b$ pozitív egészek). Véletlenszerűen kiválasztunk egy golyót az urnából, és feljegyezzük a színét. Ezután visszatesszük az urnába, és még $k$ azonos színű golyót is mellé teszünk. Majd ezt az eljárást többször megismételjük. A $k$ paraméter egy egész szám, ha negatív, akkor golyókat szedünk ki az urnából.

Mennyi annak a valószínűsége, hogy az első két alkalommal piros, harmadik alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy az első és a harmadik alkalommal piros, második alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy az első alkalommal piros, majd a következő két alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy a másodszorra választott golyó piros?
Mennyi annak a valószínűsége, hogy az először választott golyó piros, feltéve, hogy a másodszorra választott piros?

Az előző feladatban leírt véletlen folyamat (vagy sztochasztikus folyamat) a Pólya féle urnamodell, amelyet a magyar Pólya György matematikusról neveztek el. Vegyük észre, hogy a

k 1

eset épp a visszatevés nélküli, a

k 0

eset pedig a visszatevéses mintavétel. A Pólya féle urnamodellről részletesebben a Véges mintavételezési eljárások fejezetben olvashatunk.

Egy urnában eredetileg 6 piros és 4 zöld golyó van. Véletlenszerűen kiválasztunk egy golyót, majd visszatesszük az urnába, és beteszünk mellé még egy ellenkező színű golyót. Ezután többször megismételjük az eljárást.

Mennyi annak a valószínűsége, hogy az első két alkalommal piros, harmadik alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy az első és a harmadik alkalommal piros, második alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy az első alkalommal piros, majd a következő két alkalommal zöld golyót választunk?
Mennyi annak a valószínűsége, hogy a másodszorra választott golyó piros?
Mennyi annak a valószínűsége, hogy az először választott golyó piros, feltéve, hogy a másodszorra választott piros?

Véletlen tesztek

Tegyük fel, hogy egy adott véletlen kísérletben az

A

esemény érdekel minket (természetesen

A

vagy bekövetkezik, vagy nem). Azonban most nem tudjuk közvetlenül ellenőrizni, hogy

A

bekövetkezett-e. Ehelyett egy véletlen tesztet tudunk elvégezni, amely az

A

esemény bekövetkezésével kapcsolatban lehet pozitív vagy negatív. Itt azonban nagyon fontos, hogy maga a teszt is függ a véletlentől, tehát lehet, hogy a teszt eredménye hamis. Tipikusan véletlen tesztes modelleket alkalmaznak az alábbi esetekben:

Legyen

T

az az esemény, hogy a teszt szerint

A

bekövetkezett. A

T A

feltételes valószínűséget nevezik a teszt érzékenységének. A komplementer esemény, azaz a téves negatív eredmény valószínűsége

T A

feltételes valószínűséget nevezik a teszt specifikusságának. A komplementer esemény, azaz a téves pozitív eredmény valószínűsége

Gyakran a teszt fejlesztése során meghatározzák az érzékenységet, és a specifikusságot. A felhasználókat azonban a fordított irányban vett feltételes valószínűség,

A T

érdekli igazán, azaz annak a valószínűsége, hogy a vizsgált esemény bekövetkezett, feltéve, hogy a teszt pozitív (és persze

A T

, azaz annak a valószínűsége, hogy a vizsgált esemény nem következett be, feltéve, hogy a teszt negatív.

A Bayes tétel segítségével igazoljuk, hogy

A T T A A T A A T A A .

Egy tesztről tudjuk, hogy az érzékenysége 0,99, a specifikussága pedig 0,95. Tehát látszólag a teszt elég jó. Határozzuk meg $A T$ -t $A$ függvényeként, és ellenőrizzük a függvény alábbi helyettesítési értékeinek, és gráfjának helyességét:

$A$	$A T$
0.001	0.019
0.01	0.167
0.1	0.688
0.2	0.832
0.3	0.895
0.4	0.930
0.5	0.952

Meglepő módon

A T

kicsi, ha

A

is kicsi. Levonhatjuk a tanulságot, miszerint

A T

nemcsak az érzékenységtől, és a specifikusságtól függ nagyban, hanem

A

-tól is. Ezért akkor járunk el helyesen, ha

A T

-t és

A

-t hasonlítjuk össze (ahogy ezt a fenti grafikonon is tettük), nem pedig

A T

-t és

T A

-t. Ha ezt az összehasonítást végezzük, akkor valóban arra jutunk, hogy a teszt jól működik:

A T

minden esetben szignifikánsan nagyobb, mint

A

Egy nő úgy gondolja, hogy előfordulhat, hogy terhes. Vásárol egy terhességi tesztet, amely pozitív eredményt ad. A teszt érzékenysége 0,95, specifikussága 0,9. Mi a valószínűsége annak, hogy a nő valóban terhes?

Tegyük fel, hogy egy bizonyos tipusú bűncselekmény elkövetésében a bíróságra kerülő esetek 70%-ában valóban bűnös a vádlott. A levéltári adatokat megvizsgálva arra jutottunk, hogy az esküdtszékek a bűnösök 80%-át elítélik, de elítélik az ártatlanok 10%-át is. Mi annak a valószínűsége, hogy egy elítélt valóban elkövette a bűncselekményt?

Az autónk műszerfalán kigyulladt a motorhibát jelző led. A műszerfal megtekintése előtt 10% esélyt adtunk annak, hogy az autónknak súlyos motorhibája van. Tudjuk továbbá, hogy súlyos hiba esetén a lámpa 0,99 valószínűséggel kigyullad, ha azonban nincs hiba, 0,3 valószínűséggel akkor is ég. Miután megbizonyosodtunk arról, hogy ég a lámpa, mit mondhatunk, milyen valószínűséggel romlott el az autónk motorja?

Az ELISA HIV-teszt érzékenysége és specifikussága is 0,999. Véletlenszerűen kiválasztunk egy embert egy olyan populációból, ahol a lakosok 1%-a fertőzött a HIV vírussal. Feltéve, hogy a kiválasztott ember ELISA tesztje pozitív, mennyi annak a valószínűsége, hogy valóban fertőzött?

A fenti véletlen tesztekhez hasonló statisztikai eljárás a hipotézisvizsgálat, amelyről egy külön fejezetben olvashatunk itt: hipotézisvizsgálat.

Felcserélhetőség

Ebben a részben egy kicsit speciális, de még mindig nagyon fontos témát tárgyalunk.

Felcserélhető események

Tegyük fel, hogy

A i i I

egy véletlen kísérlettől függő események családja, ahol

I

megszámlálható indexhalmaz. Ezt a halmazcsaládot felcserélhetőnek nevezzük, ha közülük véges sok halmaz metszetének valószínűsége csak az összemetszett halmazok számától függ. Tehát ha

J

és

K

két véges részhalmaz

I

-ben, és

J K

, akkor

Világos, hogy a felcserélhetőség öröklődik részhalmazokra: legyen $A$ események egy családja.

Igazoljuk, hogy ha $A$ felcserélhető, akkor minden $B A$ esetén $B$ is felcserélhető.
Fordítva, igazoljuk, hogy ha minden véges $B A$ felcserélhető, akkor $A$ is felcserélhető.

Felcserélhető események esetén a szitaformula az általános esetnél lényegesen egyszerűbb alakot ölt.

Tegyük fel, hogy $A 1 A 2 A n$ felcserélhető események. $J 12 n$ -re, amint $J k$ , legyen $p k j J A j$ . Igazoljuk, hogy

i 1 n A i k 1 n 1 k 1 n k p k .

A Pólya féle urnamodellben legyen $A i$ az az esemény, hogy az $i$ -edik választott golyó piros. Igazoljuk, hogy $A 1 A 2$ felcserélhető események.

Felcserélhető valószínűségi változók

A felcserélhetőség fogalmát természetes módon terjeszthetjük ki valószínűségi változókra. Tegyük fel, hogy

C

T

-értékű valószínűségi változók osztálya. Ekkor

C

felcserélhető, ha minden

X 1 X 2 X n C

részhalmazra az

X 1 X 2 X n

véletlen vektor eloszlása csak

n

-től függ. Tehát a többdimenziós eloszlás nem változik, ha a koordinátáit permutáljuk.

Legyen $A$ események családja, és $C A A A$ a hozzájuk tartozó indikátor valószínűségi változók halmaza. Igazoljuk, hogy $A$ felcserélhető események családja pontosan akkor, ha $C$ felcserélhető valószínűségi változók halmaza.

4. Feltételes valószínűség

Definíciók, értelmezés

Az alap definíció

A nagy számok törvénye

Feltételes eloszlások

Alaptulajdonságok

Korreláció

A szorzási szabály

Feltételes valószínűség és Bayes tétel

Példák, alkalmazások

Kockák és érmék

Kártyák

Buffon féle érmedobás kísérlet

Adathalmaz elemzések

Megbízhatóság

Genetika

Urna Modellek

Véletlen tesztek

Felcserélhetőség

Felcserélhető események

Felcserélhető valószínűségi változók