Rónyai Lajos (BME Matematikai Intézet)

Mögöttes szemantikájú indexelés

A nagy dokumentum-halmazokban való keresésre szolgáló módszerek egyike a vektorteres indexelés. Ennek lényege (igen röviden), hogy a szavak és hosszabb szövegek viszonyát egy valós mátrixban tároljuk, és ennek a mátrixnak a vizsgálatával adunk választ a keresőkérdésekre. Ennek a technikának egy igen érdekes változata alakult ki a kilencvenes évek elején, az ún. mögöttes szemantikájú indexelés. A módszer a szó-szöveg mátrix Lánczos-felbontásán (szingulátris értékek szerinti felbontásán) alapul. Ez alapot ad "lényeges faktorok" kiválasztására és a bonyolult mátrix jelentős egyszerűsítésére. A matematikai/algoritmikus alapok mellett szó lesz a módszer (helyenként meglepő) alkalmazási lehetőségeiről is.

Időpont:okt. 2. kedd 16:15 Helye: BME-ELTE, I. épület E. szárny, 213.

fõoldal