Elosztott adatbányászati és statisztikai számítások

Konzulens:

Prekopcsák Zoltán doktorandusz
prekopcsak@tmit.bme.hu
BME Távközlési és Médiainformatikai Tanszék (VIK)

Gáspár-Papanek Csaba tanársegéd
gaspar@tmit.bme.hu
BME Távközlési és Médiainformatikai Tanszék (VIK)

A processzormagok és a grafikus kártyákban levő magok számának növekedésével már egy számítógépen belül is fontossá vált az algoritmusok párhuzamosítása és a terhelés elosztása. Az adatbányászati algoritmusok esetén különösen fontos a skálázhatóság és a gyors futásidő, azonban ezek az algoritmusok még nem használják ki a több magos rendszerek lehetőségeit.

A hallgató feladata, hogy megismerje az alapvető elosztási algoritmusokat (pl. MapReduce), a GPU programozás lehetőségeit és határait, valamint az elosztott adatbányászati keretrendszereket (pl. Apache Mahout), majd ebből érdeklődéstől függően további feladatokat határozunk meg.

Lehetséges feladatok:

- Komplex statisztikai, adatbányászati algoritmusok párhuzamosítása.

- Adatbányászati algoritmusok fejlesztése GPU-ra.

A téma kiválóan alkalmas szakdolgozat, diplomamunka vagy TDK készítésére is, és megfelelő teljesítmény esetén akár tanszéki projektbe is be lehet kapcsolódni. A témáról, a tanszéken folyó adatbányászati munkáról szívesen mesélünk további részleteket, keress meg minket egy kötetlen beszélgetés erejéig az I.L106a szobában, egyeztess időpontot e-mailben!

Előkövetelmények:

programozási ismeret előny, de nem feltétel.

Az egységes osztatlan alapképzés Témalabor honlapja (archív!)