Itt a bizonyíték: előterjesztőként szerepelt Magyar Péter neve az Ukrajna katonai támogatását sürgető uniós javaslatban

Az indítvány sürgeti a tagállamokat, hogy még a tárgyalások befejezése előtt biztosítsanak több fegyvert és lőszert Ukrajnának.

Az Arcanum az eltelt harmincöt évben szinte mindent beszkennelt, amit arra érdemesnek talált idehaza, felületén ma már 76 millió digitalizált oldalt böngészhetünk. Hosszú út vezetett az első flopilemeztől a mesterséges intelligenciáig, a Bibliától az üzemi lapokig. Biszak Sándorral, a családi vállalkozás alapító-tulajdonosával beszélgettünk.
Az Arcanum története a nyolcvanas évek végén kezdődött, amikor még gyerekcipőben járt a digitalizáció. Az alapító, Biszak Sándor vegyészként végzett, ám hamar rájött, hogy igazi szenvedélye az információ és annak rendszerezése. A nyolcvanas évek elején a Kőbányai Gyógyszerárugyár – mai nevén Richter Gedeon Nyrt. – könyvtárában dolgozott, ahol már hozzáférhetett a kor legmodernebb adatbázisaihoz. Az internet még csak csírájában létezett, de Sándor telefonos kapcsolat segítségével már kereshetett a nemzetközi tudományos adatbázisokban, ami lenyűgözte.
Ezzel párhuzamosan a politikai vezetés a termelőszövetkezetek mintájára engedélyt adott kisebb gazdasági egységek létrehozására, Biszak Sándor ezt kihasználva az adatbázisok fejlesztésére és terjesztésére kezdett fókuszálni. „Egy ilyen kis magánszövetkezetnél dolgoztam, kifejezetten adatbázisokkal. Az első nagy projektünk egy magyar szabadalmi adatbázis volt, még flopilemezeken terjesztettük” – idézi fel a kezdeteket. A folyamatos fejlődés eredményeként 1989-ben megszületett az Arcanum, amely a Magyar Szabadalmi Hivatallal együttműködve cd-alapú szabadalmi adatbázisokat készített.
A kilencvenes években az Arcanum úttörő szerepet játszott a digitalizációban. Olyan kiadványokat jelentetett meg cd-n, mint a Verstár, amely ötven magyar költő összes versét tartalmazta, a Biblia tizenháromféle magyar nyelvű fordításban, Jókai és Mikszáth összes műve vagy éppen A Pallas nagy lexikona. Ezek forradalminak számítottak, hiszen lehetővé tették a keresést olyan szövegekben, amelyekhez korábban csak nyomtatott formában lehetett hozzáférni. A digitalizáció fejlődésével az Arcanum új irányt vett, és a berobbanó internetre költöztette a tartalmait. Ma már az alapító gyermekei is a családi vállalkozásban dolgoznak.
„Az Arcanum több százezer felhasználót szolgál ki, különösen a költészet napján, amikor a Verstár kiemelkedő látogatottságot ér el. Idővel az újságok és folyóiratok digitalizálása is egyre nagyobb szerepet kapott. Az Arcanum Digitális Tudománytár ma már több mint 76 millió oldalt tartalmaz, és havonta másfél millió oldallal bővül,
a cél év végére a 100 millió oldal”
– árulja el a cégvezető.
Biszak Sándor az eltelt közel negyven évet állandó és organikus fejlődési folyamatként látja. Mint mondja, a technológia változásai – a flopilemeztől a mesterséges intelligenciáig – mind hozzájárultak az Arcanum sikertörténetéhez. „Az első elektronikus Bibliát még alig páran használták, ma pedig a kereshető digitális tartalom nélkülözhetetlen eszközzé vált. A vállalat mindig igyekezett egy lépéssel a piac előtt járni; e szemlélet eredménye, hogy szolgáltatása mára Európa egyik legnagyobb történelmi és tudományos adatbázisává vált. A kapacitásaink sokkal nagyobbak is lehetnének, a korlátot kizárólag az jelenti, hogy épp mihez jutunk hozzá” – jegyzi meg.
Az adatbázis kiépítése hosszú és kihívásokkal teli folyamat volt, ennek során rengeteg történelmi dokumentumot, újságot és folyóiratot sikerült megőrizni az utókornak. Biszak Sándor és csapata számára mindig kiemelten fontos volt, hogy ne csupán a klasszikus sajtótermékeket digitalizálják, hanem a kevésbé ismert, sokszor elfeledett kiadványokat is – mint például az üzemi lapokat, amelyeket az egykori dolgozók vagy leszármazottaik rendkívül nagy érdeklődéssel kutatnak.
A gyűjtés nem állt meg Magyarország határainál: Biszak Sándor és munkatársai dokumentumokat hoztak haza a környező országokból, Nyugat-Európából és az Egyesült Államokból is. Egyik legjelentősebb eredményük a Kanada Új-Brunswick tartományában található magyar könyvtár anyagainak hazaszállítása és digitalizálása volt, amihez a Petőfi Irodalmi Múzeum is segítséget nyújtott. Az amerikai magyar lapok különösen értékesnek bizonyultak, mivel olyan történelmi eseményekről tudósítottak, amelyekről a magyar sajtó nem számolhatott be. „A digitalizálás következő lépése a határon túli magyar lapokra koncentrál. Romániában már elértünk egy kritikus mennyiséget, amely elegendő ahhoz, hogy az adatbázis igazán hasznossá váljon. A tapasztalatok szerint ha egy érdeklődő egy családtagja nevére keres, szinte biztosan talál valamilyen említést, legyen az hősi halálról szóló bejegyzés vagy gyászjelentés” – magyarázza. Úgy véli, a titok is valahol itt keresendő: ez a fajta személyes kapcsolat teszi az Arcanum adatbázisát kiemelkedően értékessé a kutatók és a nagyközönség számára egyaránt.
Bár a magyarországi anyagok digitalizálása a végéhez közelít, a csapat folyamatosan keresi az új forrásokat. Jelenleg az emigráns sajtó feltérképezése zajlik: többek között München, Bécs, Dél- és Észak-Amerika egyetemi gyűjteményei is célkeresztben vannak. „E tekintetben az egyik legizgalmasabb projektünk az együttműködés kialakítása a Minnesotai Egyetemmel, amelynek gyűjteményében rengeteg magyar és más közép- és kelet-európai emigráns folyóirat található” – meséli izgatottan az alapító.
A digitalizálás sok kihívással is jár. Az egyik legnagyobb probléma a források hiányossága. A régi újságok és folyóiratok teljes évfolyamai nemritkán elvesztek, és nincs olyan könyvtár, ahol hiánytalanul fellelhetők lennének. Biszak Sándor példaként a Tolnai Világlapjának 1921-es évfolyamát említi, amelyből mindössze három szám maradt fenn, és hiába kutattak utána, a teljes sorozat egyelőre nem rekonstruálható.
Mint mondja: az együttműködések létfontosságúak a digitalizálás sikeressége szempontjából. „Magyarországon szinte minden jelentős könyvtárral kapcsolatban állunk, egyedül az Országos Széchényi Könyvtárral nem sikerült még megállapodni. Külföldön a helyi könyvtárak és egyetemi intézmények a partnereink az anyagok begyűjtésében és digitalizálásában.”
Az Arcanum elkötelezettsége a történelmi dokumentumok megőrzése iránt számos területen megmutatkozik. Biszak Sándorék ugyanis nem csupán adatbázist építenek, hanem olyan közösségi tudástárat, amely nemzedékeknek teszi elérhetővé a múlt fontos részleteit. Az alapító szerint az, hogy az emberek rátalálnak családtagjaik történetére, szakmájuk múltjára vagy szülővárosuk egykori eseményeire, igazolja a digitalizálás értelmét és jelentőségét. Az Arcanum ezen a vonalon is szeretne fejlődni, ezért nemrég pályázatot hirdetett falvak és községek számára, amely során több mint 150 falusi lapot sikerült összegyűjteniük. „Bár kérdés, hogy ez a szám a 3200 magyarországi településhez viszonyítva soknak vagy kevésnek számít, jelentős eredmény, hiszen a digitalizálási munka már a községi szintet is elérte. A beérkezett anyagok – Pusztaszabolcstól Gyékényesig, Csanádapácától Vácig – fontos források, mert lehetőséget adnak arra, hogy bárki rákeressen családja vagy környezete múltjára” – hangsúlyozza a cégvezető.
A magyar sajtó digitalizálása folyamatos, a teljes állomány körülbelül nyolcvan százaléka már elérhető digitális formában. Az eddigi munka során elsősorban a nagyobb könyvtárak, levéltárak és múzeumok anyagait dolgozták fel, a kizárólag a nemzeti könyvtárban fellelhető ritka példányok digitalizálása még várat magára. A feldolgozás határainak meghúzása is elengedhetetlenné vált: rejtvényújságok és reklámújságok például nem tartoznak a digitalizálási projekt fókuszába.
A munka több területen már befejeződött. „Egy hosszú távú projekt révén sikerült digitalizálni és kereshetővé tenni az összes magyar szabadalmi dokumentumot, beleértve az Osztrák–Magyar Monarchia korszakában bejegyzett szabadalmakat is” – említi büszkén Sándor. Ehhez hasonlóan a magyar középkori, tehát a mohácsi csata előtti oklevelek digitalizálása is lezárult, a gyűjtemény immár teljes egészében elérhető az adatbázisokban, jelentősen megkönnyítve a történészek munkáját.
Biszak Sándor szerint
a folyóiratok digitalizálásának következő szakasza össznemzeti együttműködést igényelne.
Bár a nagyobb napi- és hetilapok túlnyomó része már elérhető, a hiányzó húsz százalék feldolgozása rendkívüli erőforrásokat és együttműködést követelne meg a közgyűjtemények között. Az egyik legnagyobb kihívás a vidéki és mutációs kiadások összegyűjtése. Egyes napilapoknak ugyanis több verziója is készült, ráadásul a fővárosi és vidéki kiadás eltérhetett tartalmilag attól függően, mikor volt a nyomdai zárás.
A digitalizálás alapvető része a kutathatóság szavatolása. Egy jól felépített keresőrendszer lehetőséget ad arra, hogy a kutatók, újságírók és érdeklődők könnyedén hozzáférjenek az információkhoz. Az Arcanum vezetői kiemelt figyelmet fordítottak arra, hogy az archivált tartalmakat ne csupán digitalizálják, hanem úgy tegyék közzé, hogy a teljes szövegben lehessen keresni. E megközelítés révén a felhasználók nemcsak lapozgatnak a digitalizált újságokban, hanem kulcsszavak vagy témák alapján célzottan kutathatnak.
Biszak Sándor elárulja, hogy a keresési technológia fejlődése jelentős átalakuláson ment keresztül az évtizedek alatt. Kezdetben a szakemberek, könyvtárosok és levéltárosok számára fejlesztett rendszerek bonyolult keresési lehetőségeket kínáltak, lehetővé téve például egy adott méretű és színű könyv megtalálását. A nagyközönség igényei azonban más irányba mutattak: ők egyszerű, gyors és intuitív keresést akartak, a Google szolgáltatásához hasonlót. „A keresési mechanizmusok finomhangolása során számos technikai kihívás merült fel, például az ékezetes betűk kezelése. A megoldás az lett, hogy a keresési eredmények elsődlegesen az eredeti írásmóddal megadott találatokat mutatják, de figyelembe veszik az ékezetmentes formákat is. Ez különösen hasznos a nemzetközi környezetben, ahol a nyelvi sajátosságok befolyásolhatják az információkeresést” – magyarázza az alapító.
Az Arcanum az újságszegmentálás terén nemzetközi viszonylatban is kiemelkedő eredményeket ért el,
lehetővé tette a cikkek pontos azonosítását és szerkezeti elemeinek felismerését. Az ilyen fejlesztések révén a keresések precízebbé váltak, hiszen az egy cikkben előforduló kifejezéseket prioritásként kezelik. Emellett a szerzők és a képaláírások felismerése is sokkal hatékonyabb lett.
„A mesterséges intelligencia alkalmazása az arcfelismerés területén szintén áttörést hozott. Az adatbázisokban tárolt fotók között nemcsak név alapján lehet keresni, hanem arckép feltöltésével is azonosíthatók a személyek. Ez különösen hasznos a történelmi és sajtóarchívumokban, ahol sok esetben nincs névhez kötött információ. Az arcfelismerés technológiáját már a külföldi partnereink is átvették” – büszkélkedik a cégvezető.
A magyar nyelvű nagy nyelvi modell révén a keresési lehetőségek tovább bővültek. A tulajdonnevek felismerése lehetővé teszi, hogy a rendszer megkülönböztesse a személy-, a földrajzi és az intézményneveket, így pontosabb találatokat adjon. Ezek a fejlesztések mind azt a célt szolgálják, hogy a felhasználók minél gyorsabban és egyszerűbben megtalálják a releváns információkat.
Az adatbázis mára nélkülözhetetlenné vált a bölcsészettudományi kutatásokban Magyarországon és Romániában is, szakdolgozatok, doktori értekezések és tanulmányok elengedhetetlen forrása. Emellett a családtörténet-kutatók, helytörténészek, írók, sportkutatók, vadászok és gyűjtők is előszeretettel használják. Biszak Sándor elárulja:
az adatbázis hozzájárult már legendák tisztázásához is,
például segítségével derült fény Ady Endre állítólagos fiának kilétére.
Az Arcanum 25-30 munkavállalót foglalkoztat négy fő egységében: a szkennelési, a kötészeti, a feldolgozási és a fejlesztési részlegen. A munkafolyamat első lépése a dokumentumok beolvasása, amelyhez nagy méretű szkennereket használnak. Ez különösen fontos azoknál az országoknál, ahol nagyobb méretű újságok voltak jellemzők, például Romániában. A digitalizált állományt szükség esetén visszakötik, majd a feldolgozók ellenőrzik, és szöveges formátumban is elérhetővé teszik a tartalmat. A fejlesztői csapat pedig folyamatosan tökéletesíti a keresőrendszereket, és azon is dolgozik, hogy a felhasználói élmény minél inkább megfeleljen az elvárásoknak.
Az Arcanum tehát valódi kincsesbánya a kutatók, a családfájuk iránt érdeklődők és mindazok számára, akiket lenyűgöznek a múlt hírei. „A kultúránk akkor fejlődhet, ha a múltunkat, közös tudásunkat és identitásunkat hordozó emlékeinkből minél többet tudunk eljuttatni a lehető legtöbb emberhez, mindezt úgy, hogy a befogadókban a továbbgondolkozás igényét is elősegítjük” – ez a mottó tökéletesen leírja, mire is vállalkozott harmincöt éve az Arcanum megálmodója.
Nyitókép: Ficsor Márton