]>
Kiindulási pontunk, mint általában, most is egy véletlen kísérlet egy eseménytéren, és egy valószínűségi mérték. Tegyük fel, hogy tudjuk, hogy a esemény bekövetkezett. Ez természetesen általában befolyásolja a többi esemény valószínűségét. Ha például egy másik esemény, akkor pontosan akkor következik be, ha és is bekövetkezik. Tehát lényegében az eseményteret -re redukáltuk. Tehát valószínűsége amellett a feltétel mellett, hogy bekövetkezett, -vel kell, hogy arányos legyen.
Természetesen a bekövetkezése esetén vett feltételes valószínűségnek is valószínűségi mértéknek kell lennie, azaz teljesítenie kell a valószínűségi mértékek axiómáit. Tehát az előző aránynál a konstansnak -nek kell lennie. Így a definíciónk nem lehet más, mint a következő:
legyenek és egy véletlen kísérlettől függő események, továbbá . Ekkor az esemény -re vonatkoztatott feltételes valószínűsége
Az előző definíciót a valószínűségszámítás axiómáinak segítségével adtuk meg. Tekintsünk most ehelyett egy másik, kevésbé precíz, de intuitívabb megközelítést a relatív gyakoriságok, és a nagy számok törvénye fogalmain keresztül. Tehát tekintsünk egy kísérletet, amelyet többször, egymástól függetlenül megismételtünk. Egy tetszőleges eseményre legyen azon kísérletek száma az első kísérlet között, amelyekben bekövetkezett. Vegyük észre, hogy ekkor egy valószínűségi változó abban az összetett kísérletben, amely az eredeti kísérlet néhányszori ismétléséből áll.
Ha nagy, akkor az esemény melletti feltételes valószínűsége közel kell, hogy essen az esemény -re vonatkozó feltételes relatív gyakoriságához, azaz az esemény relatív gyakoriságához az olyan kísérletek között, amikor bekövetkezett:
De mivel ezért a nagy számok törvénye miatt
és megint ugyanahhoz a definícióhoz jutottunk.
Néha a feltételes valószínűséget egyszerűen meghatározhatjuk úgy, hogy lecsökkentjük az eseményteret, máskor azonban a fenti képletet kell használnunk.
Tegyük fel, hogy egy értékű valószínűségi változó. Ekkor az változó (valószínűség-) eloszlása egy valószínűségi mérték -n, melyre
Ha egy esemény (azaz egy részhalmaza), melynek a mértéke nem nulla, akkor az változó esemény melletti feltételes eloszlása egy valószínűségi mérték -n, melyre
Igazoljuk, hogy fix esetén egy valószínűségi mérték.
Az 1. feladat a feltételes valószínűség legfontosabb tulajdonsága, hisz emiatt minden állítás, amely igaz valószínűségi mértékekre, speciálisan igaz feltételes valószínűségi mértékekre is, amennyiben a feltétel rögzített. Így például a Valószínűségi mértékekről szóló előző fejezet 6-20. feladataival analóg állítások is igazak feltételes valószínűségekre.
Legyenek és egy véletlen kísérlettől függő események, és . Igazoljuk az alábbiakat:
Legyenek és pozitív valószínűségű események. Igazoljuk, hogy
Az (a) esetben azt mondjuk, hogy és pozitívan korreláltak. Azaz szemléletesen az egyik esemény bekövetkezése megnöveli a másik esemény bekövetkezésének valószínűségét. A (b) esetben azt mondjuk, hogy és negatívan korreláltak. Azaz szemléletesen az egyik esemény bekövetkezése csökkenti a másik esemény bekövetkezésének valószínűségét. A (c) esetben azt mondjuk, hogy és korrelálatlanok vagy függetlenek. Azaz szemléletesen az egyik esemény bekövetkezése nem befolyásolja a másik esemény bekövetkezésének valószínűségét. A függetlenség egy alapvető fontosságú fogalom, amely kiterjeszthető kettőnél több eseményre, és valószínűségi változóra is. Ezt részletesebben az ezután következő Függetlenség című fejezetben tárgyaljuk. A valószínűségi változók korrelációjáról pedig a Várható érték fejezet Kovariancia és korreláció című részében olvashatunk.
Néha előfordul, hogy egy feladatban feltételes valószínűségeket ismerünk, és ezek segítségével akarunk egyéb valószínűségeket meghatározni.
Legyen olyan véletlen események sorozata, amelyek metszete nem üres, Igazoljuk a valószínűségek szorzási szabályát:
Segítség: Használjuk a definíciót a jobb oldalon megjelenő összes feltételes valószínűségnél. Sok tag ki fog esni a szorzatból, egyedül az a tag marad benn, amelyben mind az esemény szerepel.
Az előző szorzási szabály különösen hasznos lehet az olyan összetett kísérletek esetén, ahol az egymást követő lépések kimenetelei függnek a korábbi lépések kimeneteitől (az előző jelöléssel az -edik lépésben lezajló részkísérlet). Hasonlítsuk össze a valószínűségek szorzási szabályát a kombinatorika szorzási szabályával!
Legyen események megszámlálható családja, melyek az eseményteret particionálják (az ilyen eseményeket szokás teljes eseményrendszernek nevezni), és legyen egy tetszőleges esemény.
Igazoljuk a teljes valószínűség tételét:
Segítség: vegyük észre, hogy az összeg -edik tagja , és hogy -nek egy partíciója.
Igazoljuk a Thomas Bayes-ről elnevezett Bayes tételt:
Segítség: A számláló épp , míg a nevező az 5. feladat értelmében épp .
Természetesen az előző két tétel akkor hasznos, ha ismerjük és értékeit minden -re. Ha valószínűségét az 5. feladatban igazolt teljes valószínűség tételével számoljuk ki, akkor azt mondjuk, hogy az partícióra feltételezünk (vagy kondicionálunk). A kiszámolt összegre úgy gondolhatunk, mint a számok súlyozott átlaga, ahol , és , a súlyok. A 6. feladatban igazolt Bayes tételben pedig szokás az a priori valószínűségének nevezni, a feltételes valószínűséget pedig a posteriori valószínűségnek. A feltételes valószínűség, és Bayes tétel témákról még fogunk tanulni az Eloszlások fejezet Diszkrét eloszlások részében, és a Várható érték fejezet Feltételes várható érték részében.
Legyenek és egy kísérlettől függő események, és legyen , , . Határozzuk meg a következő valószínűségeket:
Legyenek , és egy véletlen kísérlettől függő események, és legyen , és . Határozzuk meg a következő valószínűségeket:
Legyenek és egy véletlen kísérlettől függő események, és legyen , és .
Egy városban az emberek 30%-a dohányzik, és 8%-a beteg (valamilyen légzőszervi megbetegedésben). Tudjuk továbbá, hogy a dohányosok 12%-a beteg.
Tegyük fel, hogy valamilyen munka elvégzéséhez véletlen időre van szükség, ahol eloszlása egyenletes az intervallumon.
Egy kísérlet abból áll, hogy feldobunk két hagyományos, igazságos kockát, és a dobott számokat feljegyezzük az vektorba. Legyen a dobott számok összege. Az alábbi eseménypárok mindegyikénél határozzuk meg mindkét esemény valószínűségét, mindkét eseménynek a másikra, mint feltételre vonatkoztatott feltételes valószínűségét, és döntsük el, hogy az adott események pozitívan korreláltak, negatívan korreláltak, vagy függetlenek!
Vegyük észre, hogy a pozitívan korreláltság nem tranzitív reláció! Például az előző feladatban és pozitívan korreláltak, és szintén pozitívan korreláltak, de és negatívan korreláltak (sőt, diszjunktak!).
A kockadobás kísérletben állítsuk be az paraméterértéket! Szimuláljunk 500 kísérletet, és számítsuk ki az előző feladatban meghatározott feltételes valószínűségekhez tartozó relatív gyakoriságokat!
Tekintsük megint azt a kísérletet, amely abból áll, hogy feldobunk két hagyományos, igazságos kockát, és a dobott számokat feljegyezzük az vektorba. Legyen a dobott számok összege. Határozzuk meg az vektor feltételes eloszlását amellett a feltétel mellett, hogy .
A kocka- és érmedobás kísérletében először feldobunk egy szabályos, igazságos kockát, majd feldobunk annyi pénzérmét, amennyit a kockánk mutat.
Szimuláljunk 200 darab kocka-, és érmedobás kísérletet!
Tegyük fel, hogy egy zsákban 12 érme van: 5 igazságos, 4 olyan hamis érme, ahol a fejdobás valószínűsége ; és 3 érme mindkét oldala fej. Kiválasztunk véletlenszerűen egy érmét a zsákból, és azt feldobjuk.
Hasonlítsuk most össze a 15. feladatot és a 17. feladatot! A 15. feladatban az függ a véletlentől, hogy hányszor dobunk fel egy érmét, míg a fejdobás valószínűsége determinisztikus. A 17. feladat viszont felfogható úgy, hogy a dobások száma determinisztikus, míg a fejdobás valószínűsége függ a véletlentől. Azt a kísérletet, amelyben -szer dobunk fel egy olyan érmét, amelyben a fejdobás valószínűsége (tehát mindkét paraméter determinisztikus), és paraméterű binomiális kísérletnek nevezzük. Ez egy nagyon fontos kísérlet, melyről részletesebben a Bernoulli kísérletek fejezet binomiális eloszlás című részében olvashatunk. Tehát a 15. és a 17. feladat a binomiális kísérlet olyan módosításai, melyekben az egyik paramétert véletlenítettük. Általában is igaz, hogy sok érdekes, új kísérlet gyártható oly módon, hogy egy hagyományos kísérlet néhány paraméterét a véletlentől teszünk függővé.
Az érme- és kockadobás kísérletében először feldobunk egy szabályos érmét, majd ha ez írást mutat egy igazságos kockát dobunk fel, ha pedig fejet mutat, egy egy-hat irányban lapos kockát dobunk fel. Ez utóbbi az 1 és 6 értékeket , a 2,3,4 és 5 értékeket valószínűséggel mutatja.
Szimuláljunk 500 darab érme- és kockadobás kísérletet az előző feladat paramétereivel!
Tekintsük azt a kártya kísérletet, amelyben 2 kártyát választunk ki egy pakliból. -re legyen az az esemény, hogy az -edik kártya dáma, pedig az az esemény, hogy az -edik kártya kőr. Az alábbi eseménypárok mindegyikénél határozzuk meg mindkét esemény valószínűségét, mindkét eseménynek a másikra, mint feltételre vonatkoztatott feltételes valószínűségét, és döntsük el, hogy az adott események pozitívan korreláltak, negatívan korreláltak, vagy függetlenek!
A kártya kísérlet szimulációjában állítsuk be az paraméterértéket! Szimuláljunk 500 kísérletet, s számítsuk ki az előző feladatban meghatározott feltételes valószínűségekhez tartozó empirikus feltételes valószínűségeket!
Tekintsük a kártya kísérletet most kártyával. Határozzuk meg az alábbi események valószínűségét!
A kártya kísérlet szimulációjában állítsuk be az paraméterértéket! Számítsuk ki az előző feladatban szereplő események relatív gyakoriságát, és vessük azokat össze a valódi valószínűségekkel!
A Buffon féle érmedobás kísérletben egy sugarú érmét véletlenszerűen feldobunk egy olyan padló felett, melyet 1 egység oldalhosszúságú négyzet alakú csempékkel raktunk ki. Miután az érme földet ér, a középpontjának koordinátáit az vektorba feljegyezzük, ahol az origó annak a csempének a középpontja, amelyikre az érmeközéppont esik, a koordinátatengelyek pedig párhuzamosak a csemperács éleivel.
Szimuláljunk 500 darab Buffon féle érmedobás kísérletet, és határozzuk meg az esemény empirikus feltételes valószínűségét amellett a feltétel mellett, hogy , majd az eredményt vessük össze az előző feladatban kiszámolt pontos valószínűséggel!
Az M&M adathalmazban határozzuk meg annak az eseménynek az empirikus feltételes valószínűségét, hogy egy zacskóban legalább 10 piros cukorka van, feltéve, hogy a zacskó tömege legalább 48 gramm!
Nyissuk meg a Kabóca adathalmazt!
Egy gyárban 3 különböző technológiával állítanak elő memóriakártyákat. Az első technológiával gyártják a memóriakártyák 50%-át, az esetek 4%-ában selejtesen. A második technológiával a memóriakártyák 30%-át állítják elő, és az eljárás az esetek 5%-ában selejtes terméket gyárt. Végül a harmadik technológiát használják az esetek 20%-ában, és itt minden századik termék selejtes. Véletlenszerűen kiválasztunk egy memóriakártyát.
Alapvető genetikai modelleket már tárgyaltunk a Valószínűségi mértékek fejezetben.
A következő feladatban tegyük fel, hogy a szóban forgó borsó hüvelyének színe zöld, vagy sárga lehet, és a zöld színt hordozó gén domináns. Azaz a és a genotipusú borsó zöld lesz, a genotipusú pedig sárga.
Egymás mellett nevelünk két borsó palántát, az egyik zöld, a másik sárga hüvelyű. Tudjuk továbbá, hogy a zöld növény valószínűséggel hordozza a sárga színt okozó gént.
Egymás mellett nevelünk két zöldhüvelyű borsó palántát. Tegyük fel, hogy valószínűséggel egyik növényünk sem hordozza a recesszív gént, továbbá valószínűséggel pontosan az egyik, valószínűséggel pedig mindkét növényünk hordozza a recesszív gént.
Mint már korábban is tárgyaltuk, a nemtől függő öröklődő emberi rendellenességet az X kromoszómák hibája okozza. Jelölje a normális, egyben domináns gént, pedig a rendellenességet okozó gént. Így egy genotipusú nő egészséges, egy genotipusú nő szintén tünetmentes, de hordozza a rendellenességet, egy genotipusú nő pedig beteg. Egy genotipusú férfi egészséges, egy genotipusú pedig beteg. A dikromácia nevű rendellenesség (ami a színvakság egy fajtája) ilyen tipusú betegség, ezért gyakoribb a férfiaknál.
Tegyük fel, hogy egy adott populáció fele férfi, fele nő. Továbbá a férfiak 10%-a színtévesztő, még a nőknél ez az arány csak 1%.
Tegyük fel, hogy egy házaspár mindkét tagja egészséges, azonban a nő valószínűséggel hordozza a színtévesztést okozó gént.
Az első urnánkban 4 piros és 6 zöld golyó van, míg a másodikban 7 piros és 3 zöld. Véletlenszerűen kiválasztunk egy urnát, majd abból egy golyót.
Az első urnánkban 4 piros és 6 zöld golyó van, míg a másodikban 6 piros és 3 zöld. Kihúzunk egy golyót az első urnából, és azt áttesszük a másodikba. Ezután kihúzunk egy golyót a második urnából is.
Egy urnában eredetileg darab piros, és darab zöld golyó van ( és pozitív egészek). Véletlenszerűen kiválasztunk egy golyót az urnából, és feljegyezzük a színét. Ezután visszatesszük az urnába, és még azonos színű golyót is mellé teszünk. Majd ezt az eljárást többször megismételjük. A paraméter egy egész szám, ha negatív, akkor golyókat szedünk ki az urnából.
Az előző feladatban leírt véletlen folyamat (vagy sztochasztikus folyamat) a Pólya féle urnamodell, amelyet a magyar Pólya György matematikusról neveztek el. Vegyük észre, hogy a eset épp a visszatevés nélküli, a eset pedig a visszatevéses mintavétel. A Pólya féle urnamodellről részletesebben a Véges mintavételezési eljárások fejezetben olvashatunk.
Egy urnában eredetileg 6 piros és 4 zöld golyó van. Véletlenszerűen kiválasztunk egy golyót, majd visszatesszük az urnába, és beteszünk mellé még egy ellenkező színű golyót. Ezután többször megismételjük az eljárást.
Tegyük fel, hogy egy adott véletlen kísérletben az esemény érdekel minket (természetesen vagy bekövetkezik, vagy nem). Azonban most nem tudjuk közvetlenül ellenőrizni, hogy bekövetkezett-e. Ehelyett egy véletlen tesztet tudunk elvégezni, amely az esemény bekövetkezésével kapcsolatban lehet pozitív vagy negatív. Itt azonban nagyon fontos, hogy maga a teszt is függ a véletlentől, tehát lehet, hogy a teszt eredménye hamis. Tipikusan véletlen tesztes modelleket alkalmaznak az alábbi esetekben:
Legyen az az esemény, hogy a teszt szerint bekövetkezett. A feltételes valószínűséget nevezik a teszt érzékenységének. A komplementer esemény, azaz a téves negatív eredmény valószínűsége
A feltételes valószínűséget nevezik a teszt specifikusságának. A komplementer esemény, azaz a téves pozitív eredmény valószínűsége
Gyakran a teszt fejlesztése során meghatározzák az érzékenységet, és a specifikusságot. A felhasználókat azonban a fordított irányban vett feltételes valószínűség, érdekli igazán, azaz annak a valószínűsége, hogy a vizsgált esemény bekövetkezett, feltéve, hogy a teszt pozitív (és persze , azaz annak a valószínűsége, hogy a vizsgált esemény nem következett be, feltéve, hogy a teszt negatív.
A Bayes tétel segítségével igazoljuk, hogy
Egy tesztről tudjuk, hogy az érzékenysége 0,99, a specifikussága pedig 0,95. Tehát látszólag a teszt elég jó. Határozzuk meg -t függvényeként, és ellenőrizzük a függvény alábbi helyettesítési értékeinek, és gráfjának helyességét:
0.001 | 0.019 | |
0.01 | 0.167 | |
0.1 | 0.688 | |
0.2 | 0.832 | |
0.3 | 0.895 | |
0.4 | 0.930 | |
0.5 | 0.952 |
Meglepő módon kicsi, ha is kicsi. Levonhatjuk a tanulságot, miszerint nemcsak az érzékenységtől, és a specifikusságtól függ nagyban, hanem -tól is. Ezért akkor járunk el helyesen, ha -t és -t hasonlítjuk össze (ahogy ezt a fenti grafikonon is tettük), nem pedig -t és -t. Ha ezt az összehasonítást végezzük, akkor valóban arra jutunk, hogy a teszt jól működik: minden esetben szignifikánsan nagyobb, mint .
Egy nő úgy gondolja, hogy előfordulhat, hogy terhes. Vásárol egy terhességi tesztet, amely pozitív eredményt ad. A teszt érzékenysége 0,95, specifikussága 0,9. Mi a valószínűsége annak, hogy a nő valóban terhes?
Tegyük fel, hogy egy bizonyos tipusú bűncselekmény elkövetésében a bíróságra kerülő esetek 70%-ában valóban bűnös a vádlott. A levéltári adatokat megvizsgálva arra jutottunk, hogy az esküdtszékek a bűnösök 80%-át elítélik, de elítélik az ártatlanok 10%-át is. Mi annak a valószínűsége, hogy egy elítélt valóban elkövette a bűncselekményt?
Az autónk műszerfalán kigyulladt a motorhibát
jelző led. A műszerfal megtekintése előtt 10% esélyt adtunk annak, hogy az autónknak súlyos motorhibája van. Tudjuk továbbá, hogy súlyos hiba esetén a lámpa 0,99 valószínűséggel kigyullad, ha azonban nincs hiba, 0,3 valószínűséggel akkor is ég. Miután megbizonyosodtunk arról, hogy ég a lámpa, mit mondhatunk, milyen valószínűséggel romlott el az autónk motorja?
Az ELISA HIV-teszt érzékenysége és specifikussága is 0,999. Véletlenszerűen kiválasztunk egy embert egy olyan populációból, ahol a lakosok 1%-a fertőzött a HIV vírussal. Feltéve, hogy a kiválasztott ember ELISA tesztje pozitív, mennyi annak a valószínűsége, hogy valóban fertőzött?
A fenti véletlen tesztekhez hasonló statisztikai eljárás a hipotézisvizsgálat, amelyről egy külön fejezetben olvashatunk itt: hipotézisvizsgálat.
Ebben a részben egy kicsit speciális, de még mindig nagyon fontos témát tárgyalunk.
Tegyük fel, hogy egy véletlen kísérlettől függő események családja, ahol megszámlálható indexhalmaz. Ezt a halmazcsaládot felcserélhetőnek nevezzük, ha közülük véges sok halmaz metszetének valószínűsége csak az összemetszett halmazok számától függ. Tehát ha és két véges részhalmaz -ben, és , akkor
Világos, hogy a felcserélhetőség öröklődik részhalmazokra: legyen események egy családja.
Felcserélhető események esetén a szitaformula az általános esetnél lényegesen egyszerűbb alakot ölt.
Tegyük fel, hogy felcserélhető események. -re, amint , legyen . Igazoljuk, hogy
A Pólya féle urnamodellben legyen az az esemény, hogy az -edik választott golyó piros. Igazoljuk, hogy felcserélhető események.
A felcserélhetőség fogalmát természetes módon terjeszthetjük ki valószínűségi változókra. Tegyük fel, hogy -értékű valószínűségi változók osztálya. Ekkor felcserélhető, ha minden részhalmazra az véletlen vektor eloszlása csak -től függ. Tehát a többdimenziós eloszlás nem változik, ha a koordinátáit permutáljuk.
Legyen események családja, és a hozzájuk tartozó indikátor valószínűségi változók halmaza. Igazoljuk, hogy felcserélhető események családja pontosan akkor, ha felcserélhető valószínűségi változók halmaza.