A processzormagok és a grafikus kártyákban levő magok számának növekedésével már egy számítógépen belül is fontossá vált az algoritmusok párhuzamosítása és a terhelés elosztása. Az adatbányászati algoritmusok esetén különösen fontos a skálázhatóság és a gyors futásidő, azonban ezek az algoritmusok még nem használják ki a több magos rendszerek lehetőségeit.
A hallgató feladata, hogy megismerje az alapvető elosztási algoritmusokat (pl. MapReduce), a GPU programozás lehetőségeit és határait, valamint az elosztott adatbányászati keretrendszereket (pl. Apache Mahout), majd ebből érdeklődéstől függően további feladatokat határozunk meg.
Lehetséges feladatok:
- Komplex statisztikai, adatbányászati algoritmusok párhuzamosítása.
- Adatbányászati algoritmusok fejlesztése GPU-ra.
A téma kiválóan alkalmas szakdolgozat, diplomamunka vagy TDK készítésére is, és megfelelő teljesítmény esetén akár tanszéki projektbe is be lehet kapcsolódni. A témáról, a tanszéken folyó adatbányászati munkáról szívesen mesélünk további részleteket, keress meg minket egy kötetlen beszélgetés erejéig az I.L106a szobában, egyeztess időpontot e-mailben!
Előkövetelmények:
programozási ismeret előny, de nem feltétel.
|