Koha integrált könyvtári rendszer a BME Matematika Intézet Könyvtárában

CSIZMADIA ÁKOS
közzététel: 2013. május 8.


A Budapesti Műszaki és Gazdaságtudományi Egyetem Matematika Intézet Könyvtára 2013. április 30-án lezárta a CDS/ISIS for Windows 1.4 elektronikus könyvtári katalógus építését, befejezte használatát, és 2013. május 2-án áttért a Koha nyílt forráskódú, linux operációs rendszer alatt futó integrált könyvtári rendszerre. Tudomásunk szerint ezzel a BME Matematika Intézet Könyvtár az első, amely Magyarországon nyílt forráskódú (open source) integrált könyvtári rendszert használ.
  A koha maori szó; jelentése ajándék, adomány. Nevéhez híven a program ingyenesen és bárki számára nyíltan hozzáférhető. A maori eredet sem véletlen: a Koha Új-Zélandról terjedt el a világban. A rendszert a Horowhenua Library Trust számára fejlesztették 1999-ben, és 2000 januárjától ők is voltak első használói. Könyvtárunk 2012 júniusában a 3.08.01.002 verziót telepítette.

  A BME Matematika Intézet 1996-ban alakult meg. Ezt követően létrehozták, öt tanszék összevonásával, az Intézet könyvtárát is. 1997-ben vezették be az elektronikus nyilvántartást, rendszerként pedig a fent említett, UNESCO által közreadott, ingyenesen hozzáférhető CDS/ISIS for Windows 1.4-re esett a választás. A rendszerbeállításokat és az adatfelvitelt praktikus szempontok vezérelték: az Intézet élete, a matematikus-képzés elindulása a munka folyamatosságát követelték meg, ezért minél gyorsabban üzemeltetni kellett az ISIS-t. A rendszerbeállítások így a magyar  szabványhoz idomuló, de azzal nem megegyező bibliográfiai leírások készítését tették lehetővé. A leírásokba - a gyors adatfelvitel során - több módszertani és nagyon sok gépelési hiba csúszott be.

  Az ISIS-ről egy új könyvtári rendszerre való áttérés gondolata 2007-ben fogalmazódott meg. A minimális cél az volt, hogy a könyvtár állománya on-line kereshetővé váljék - ez megvalósulhatott volna az ISIS átalakításával is. A minden igényt kielégítő megoldás azonban egy jól használható, integrált könyvtári rendszerre történő váltás lett volna, lehetőleg egy ingyenes, nyílt forráskódú szoftver üzemeltetésével, amely képes megfelelni a könyvtárakkal szemben támasztott újabb elvárásoknak is. A fentiekből kiolvasható praktikus szempontok - anyagi kérdések, on-line kereshetőség, korszerűség - azonban csak első, durva közelítését adják az új rendszerre való áttérés motivációinak. A megoldandó feladatra általánosabban tekintettünk, a következők szerint. 1. Az adatok migrációja egyik rendszerből a másikba, a lehető legautomatizáltabb módon. 2. A nyílt forráskódú, linux alapú szoftverhasználat kultúrájának terjesztése, erősítése. 3. Könyvtárunk egy egyetem természettudományi kara matematika intézetének része, azaz nem lehet tőle idegen a kísérletezés, új dolgok kipróbálása, bevezetése, működtetése, megoldások keresése. Itt megjegyzendő, hogy egyetemi oktató- és kutatóintézet könyvtáraként számunkra a Koha angol nyelve sem jelent hátrányt. A tudomány nemzetközi, jelen korunkban nyelve az angol, az olvasók között pedig többeknek - külföldi kutatóknak, diákoknak - éppen a magyar felület okozhatna nehézségeket. A Kohában sem az adminisztrációs, sem az olvasói oldalon nem láttuk, hogy értelmezési nehézségekkel kellene szembenéznünk. Egyébként számos helyen egyszerűen lehetne végrehajtani magyarításokat, ám ezektől, éppen kétséges hasznukat látva, eltekintettünk.

  Szempontjainknak tájékozódásunk, majd később tesztjeink szerint is, a Koha integrált könyvtári rendszer megfelelt. Az alapfeladat - a rendszer telepítésén, tulajdonságainak beállításán és üzemeltetésén túl - az ISIS-ből xml formátumban kimenthető adatbázis MARC21-rekordokká alakítása, majd azok Kohába való áttöltése volt. Mivel az 1997-es adatbevitelkor számos hiba került a leírásokba, valamint a 2010-2011 folyamán zajlott selejtezés miatt 4477 rekordot törölni kellett volna, mindenképpen szükséges volt egy önálló program megírása, amely adattisztítás után olyan file-t ad kimenetül, amelyből könnyen tudunk majd MARC21 formátumú rekordokat előállítani.

  Mindenek előtt megjegyezzük, hogy a mi megoldásunk, az adattisztító szoftver révén, egyedi. Ám legalább két másik, egyszerűnek tűnő és mások által kipróbált útja létezik az ISIS-Koha konverziónak:

1. Az ingyenes MarcEditor program menüje tartalmaz "CDS/ISIS.iso to MARC translation" menüpontot: ez az ISIS .iso kiterjesztésű, exportált file-ját átalakítja MARC21 rekordokká, és némi szerkesztés után valóban használható marcokat kaphatunk. E folyamat részletes és szemléletes leírása megtalálható itt.

2. Szintén járható út, ahogy ezt maga a Koha felhasználói kézikönyve ajánlja, a MarcEditor segítségével excel-file-ból MARC21 előállítása. Ehhez előzetesen az ISIS MAG.xml-jének excel-táblázattá alakítása szükséges.

  A mi ISIS-Koha konverziónk az alábbiak szerint zajlott. Adattisztítást csak az ISIS-ből kimentett xml-en volt lehetséges végezni (a .iso kiterjesztésű exportált file-on nem), azaz a MAG.xml-re kellett megírnunk az adattisztító programot. Kérdés volt az adattisztító program kimeneti file-jának formátuma. Az xml-nek nem volt értelme, mivel közönséges xml-lel a MarcEditor nem tudott dolgozni. Az ISIS-nél a MAG.xml csak egy exportlehetőség, azt az ISIS egyébként nem használja: azaz, a tisztított xml-t újra az ISIS-be töltve nem írtuk volna felül az addigi, nem tisztított rekordokat: nem tudtuk volna .iso-ként kimenteni az új adatokat, hogy azzal dolgozzunk tovább, az 1. út szerint.

  A megoldásnak az egyszerű text-kimenet tűnt. Szövegből azonban a MarcEditor egyszerre legfeljebb négy MARC21-rekordot volt képes előállítani. Mégis feltettük, hogy bizonyosan létezik más olyan program, amely az egyszerű txt-t át tudja alakítani MARC21-ekké. És valóban: a Libary of Congress oldalán szabadon elérhetők a MARCMaker és a MARCBreaker porgramok. A MARCMakernek (marcmakr.exe) két komoly korlátja van: egyrészt Windows alatt fut, és XP a legmagasabb verzió, ahol még működik. Másrészt erősen érzékeny a méretre: a mi 6,8 MB-os txt-file-unkkal sikeresen megbirkózott, de kísérleteink szerint ennek kétszeresével, 13,6 MB-tal már kudarcott vallott.
  A konverzió váza tehát a következő volt: az ISIS MAG.xml-jét egy számos javítást elvégző, txt-kimenetet adó adattisztító programon futtattuk végig, majd ezt a txt-t a MARCMaker segítségével MARC21-rekordokká alakítottuk, amelyeket már betölthettünk a Kohába.

  Részletezve a teljes folyamatot:

  A konverzió elvét Kővári Bence, a BME Automatizálási és Alkalmazott Informatikai Tanszék doktorandusza dolgozta ki 2010 tavaszán. Eszerint az ISIS-ből kimentett xml-file excel-táblázattá alakítható, amelyen jól kereshetők azok a szükséges javítások, amelyek elvégzését, tömegességük miatt, érdemes automatizálni. A javítandó adatokra adattisztító program írandó, amely kimenete a MarcEditor programmal MARC21-formátumú rekordokká alakítható, majd a kapott MARC21-ek betöltendők a KOHÁ-ba.

  2011 szeptemberében telepítettük az első Kohát tesztelési céllal. Ezt megelőzően, 2011 márciusában Dmitriy Dunaev, a BME Automatizálási és Alkalmazott Informatikai Tanszék doktorandusza vette át a konverzió feladatait Kővári Bencétől. Dmitriy Dunaev munkájának eredményeként készült el az adattisztító program. Az adattisztító program leírásbeli hibajavító-feladatait Hegedüs Nóra és Csizmadia Ákos fogalmazták meg. Hegedüs Nóra több száz rekordon végzett manuálisan is javítást.

  Az ISIS-mezők MARC21-megfeleltetéseit, a kimeneti txt-file struktúráját (tekintettel a Koha sajátosságaira is) Csizmadia Ákos dolgozta ki.

  A Koha telepítéseit Gergi Miklós, a BME Matematika Intézet rendszergazdája végezte el. (A 2011-es teszt-Koha után 2012 májusában telepítettünk egy újabb verziót, majd 2012. júniusban ma működő rendszert.)

  Maga az eredmény legfőképpen a 2012. július 4-i adatáttöltést megelőző, 16 hónapos munka, számos megbeszélés, teszt, gondolkodás eredménye Dmitriy Dunaev és Csizmadia Ákos között. Mindeközben ugyanis, mint a fentiekből is kiolvasható, számos lehetőséget kellett kipróbálnunk, több program korlátjaival találtuk szembe magunkat, és rengeteg részleten kellett többször változtatni. Dmitriy Dunaev LibConvert elnevezésű programja az 1.0-ás verzióról indult, és a 13. változattal nyerte el 2012. június végén 2.3-as, végleges alakját.
  Külön is említendő: sok gondolkodásra adott alkalmat, hogy egy magyar szokás szerint épült, de nem teljesen a magyar szabványt követő program adatait kellett angolszász (a MARC21 szabvány USA-kanadai) környezetre átültetni, a Koha számára megfelelő struktúra szerint.


  2012. július 4-én végül az alábbi, percre pontos menetrend szerint töltöttük át az ISIS-ből a Kohába az adatokat, bibliográfiai adatvesztés nélkül:

10:51-10:54: CDS/ISIS-ből, az adatok frissítése után, azok xml-ben (MAG.xml) való kimentése.
10:55: Dmitriy Dunaev adattisztító és konvertáló programjának, a LibConvert 2.3-nak indítása. 27602 rekord betöltése.
10:56: A LibConvert 18 szabályt alkalmaz (pl. részleges vagy teljes törlés, vágás, cserék stb.) az xml-re. Összesen 413 439 szabályalkalmazás, azaz javítás történik.
10:58: A 2010-2011-ben selejtezett könyvek törlése (4477 darab) a LibConverttel. 23 125 darab rekord marad.
10:59: A text kimeneti file előállítása.Az exportált txt 6 805 453 byte-os.
11:01: A MARCMaker (marcmakr.exe) 7 219 130 byte-os mrc-t állít elő a txt-ből.
11.02-11.08: Olvasható mrk-file előállítása MarcEditorral a marcmakr.exe mrc-jéből; adatellenőrzés a MarcEditor Marc Validator és Field Counter funkcióival.
11:10: Belépés a Kohába, "upload file" utasítás kiadása a MarcEditor szerint hibátlan marc-file-ra.
11:11: "Stage for import" utasítás kiadása a Kohában. 23 125 darab, azaz az összes rekord jól feltöltődött.
11:16: "Import to catalog" utasítás kiadása.
11:30: A Koha elvégezte a katalógusba importálást, vége a folyamatnak.

  Ettől kezdve a Koha mint katalógus párhuzamosan épült az ISIS-szel. Mivel a Könyvtár rendes munkamenetben működött, csak 2013 áprilisában tudtuk felvinni a kölcsönzőket és a kölcsönzéseket, és ekkor, a folyamatban lévő állományellenőrzés eredményeit is jelölve, a lehető legpontosabban megadtuk a kötetek elérhetőségére vonatkozó adatokat. Mindeközben testre szabtuk új rendszerünket, és a 2013. május 1. körüli napokat jelöltük ki a teljes váltásra. Május 2-án az ISIS végleges mentésével lezártuk annak használatát, és egyedül a Kohát üzemeltettük tovább.