Hasonlóságok, minták, anomáliák keresése hálózati forgalomban
Egy mai hálózat működésével kapcsolatban rengeteg adatot naplóznak; nagy gond, hogy nem látjuk a fától az erdőt, nem tudjuk, melyik adat fontos és minek a megváltozása függ össze valami mással.
A feladat olyan matematikai módszerek kidolgozása és jellemzése, amelyek segítenek feltárni az adatok közötti nemtriviális összefüggéseket; ill. úgy csoportosítják az "atomi" megfigyeléseket, hogy ismert makroszkopikus jelenségekre tudjunk következtetni (pl. "1000 emailt küldtünk ki az elmúlt két percben"+"általában percenként 10-20 emailt küldünk"+"a kiküldött emailek méretének eloszlása nagyon koncentrált" -> alighanem spamet vagy férgeket küldünk).
A feladat megoldásához szükségesnek látszik az idősorok analízisében való jártasság; segíthet a fuzzy rendszerek elmélete és a Bayes-hálók ismerete.
Olyan hallgatókat várunk, akik önállóan tudnak és szeretnek dolgozni, mert a feladat matematikai részében érdemi segítséget nem tudunk adni (leszámítva a modellalkotást).
Természetesen biztosítunk publikációs- és TDK-lehetőséget, a téma akár a PhD-ig és tovább is folytatható.
Jó passzív angolnyelv-tudás elengedhetetlen.
Konzulens:
Korn András <
korn@tmit.bme.hu>, Távközlési és Médiainformatikai Tanszék