a rovat írásai

Europeana: Magyarország a régió élén áll a feltöltésben

Egészen előkelő helyen van Magyarország a régióban az unió digitális könyvtárába való feltöltések számát tekintve. A 2008-ban induló Europeana Közép-Kelet európai feltöltői között Ausztria mögött a második helyen állunk az egymilliót jócskán meghaladó anyaggal.

Digitalizálták az Örök Várost

Csaknem 4000, Rómáról készült 16-20. századi történelmi ábrázolást, köztük festményeket, nyomtatványokat és rajzokat digitalizált és tett közzé a világhálón kutatók egy csoportja.

Közgyűjteményi digitalizálási stratégia: előny a fogyasztónál

Elkészült a közgyűjteményi digitalizálási stratégia, amelynek célja biztosítani a közgyűjteményi tartalmak minél szélesebb körű, akadálytalan hozzáférését a kultúrafogyasztók számára.

Norvégia egyszerűen digitalizálja Nigéria irodalmát

A Norvég Nemzeti Könyvtár digitalizálja a nigériai irodalmat egy olyan példa nélkül álló konstrukció keretében, amely a felek reményei szerint mintaként szolgál más országok számára is, és segít létrehozni egy önálló afrikai digitális könyvtárat.

Itt van szinte minden, ami '56-ról fennmaradt

Magyar Október címmel készített az Országos Széchényi Könyvtár (OSZK) szabadon elérhető online adatbázist, amelyen keresztül az 1956-os forradalomról fennmaradt fotókat és mozgóképes anyagokat az események helyszíneihez rendelve térképen böngészhetik az érdeklődők, valamint elérhetik a Szabad Európa Rádió magyar osztályának archív hanganyagait is.

Rembrandt rajzára leltek a digitalizálás során

Alapos vizsgálatok után Rembrandtnak tulajdonított egy tulajdonában lévő állatrajzot a braunschweigi Herzog Anton Ulrich Múzeum.

375 ezer műalkotás fotója ingyen

Ezentúl szabadon letölthetők és felhasználhatók azok a digitalizált fotók, amelyek a New York-i Metropolitan Múzeum gyűjteményének egy jelentős részéről készültek – jelentette be az intézmény.

57 útvonalon sétálgathatunk a Vatikánban

A Vatikán legféltettebb kincsei is megcsodálhatók a Vatikáni Múzeumok teljesen megújult és modernizálódott honlapján, amelyet most mutattak be a sajtónak.

Moldvai cigány családi hagyatékok digitalizálása

A British Library Endangered Archives programja legújabb támogatásának köszönhetően egy moldvai cigány közösség családi hagyatékanyagát böngészhetjük online.

A független Burma a helyi lakosok fotóin

Az Endangered Archive projektjeiről már korábban is  tudósítottunk. Egyik legutóbbi vállalkozásuk keretében régi burmai negatívokat digitalizáltak és tettek nagy felbontásban elérhetővé. A szocialista Burma életébe bepillantást nyújtó fotók ritka kuriózumnak számítanak.

Itt az új Lánchíd-adatbázis

Most már nem csak magyar forrásokat, hanem az angol nyelvű dokumentumokat és forrásanyagokat is tanulmányozhatjuk online.

Digitalizálás összes cikke »

Óvatos megközelítésben

mdmk leadSzubjektív könyvfesztiváli beszámoló az Arcanum Adatbázis Kft. digitalizálási konferenciájáról.

Sokat gondolkoztam saját nézőponton, mielőtt írni kezdtem "helyszíni tudósításomat" a Millenáris Fogadójában megrendezett pénteki eseményről. Hogy miért? A rendezvényt a magyar kultúra digitalizálásában (mennyiségét tekintve mindenképpen) megkérdőjelezhetetlen elsőséggel bíró Arcanum hívta össze, és nyilván a téma fontosságára tekintettel töltötték meg a Lázár Ervin termet érdeklődők, szakmabeliek.

Emlékszem, a tavalyi, hasonló tanácskozásra a Google közép-európai részlegétől jött az első előadó, lehengerlő stílusban tudott számokat mondani, amelyek mögött feltűnően sok nulla szerepelt. Valóban, úgy tűnt, a Google robotjai (amelyeket, mondom némi kajánsággal, szerencsére nem a bolygó felszántására programoztak be) minden humán beosztottnál monotonabb szívóssággal tapogatják le annak nagy részét, amit az emberi civilizáció az elmúlt századokban nyomdafestékkel összefeketített. Mivel tavaly, ugyanebben a teremben projektekben gondolkoztunk, pontosan láttuk a végét is a folyamatnak. Tehát megképződött előttünk a dátum, amikor összeáll annyi 0 és 1 jel, amelyre azt mondják (statisztikusok, megszállottak, fejszámolók), hogy az összesnek (megjegyzés a noteszbe: definíciója tisztázandó!) 60 vagy 80%-a, és egy helyen, meghatározott kapacitású és a költségkeretbe éppen beleférő szerverparkban tárolódik és szolgáltatódik a 7 milliárdnak. Vagy (az idő előre haladtával) majd egy gombostűfejben, 10 milliárdnak. De mi legyen az árva művek jogaival (jogilag árva műveknek számítanak az ismeretlen szerzőjű alkotások), erről esett akkor a legtöbb szó.

Gondolom, a fickó aztán kiment a Liszt Ferencre, a Google Books projektben pedig sok minden történt egy év alatt – bár egy vele vetélkedő terv bejelentője éppen a napokban nevezte szimplán halottnak, hogy aztán maga is valami nagyon hasonlóval álljon elő (tervvel, amelyet a korábbinál is dörzsöltebb jogászok kivihetőnek tartanak, mert a fránya szerzői jogok, azokkal mindenkinek meggyűlik a baja).

A Google által végrehajtott digitalizálás lényege (mint tudjuk), hogy ember nem látja a szöveget (csak arra vannak a rabszolgák, hogy magát a kötetet a szkennelő robothoz vigyék, aztán onnan elszállítsák, vissza a polcra, vagy egyenest a kemencébe, ízlés és optimizmus dolga). A ma alkalmazott ocr-ek, optikai szövegfelismerő programok, pláne a nagy nyelvekre, egészen pontos eredményt produkálnak; a papír állagától, életkorától, színétől, a betűtípustól, a nyomtatás minőségétől függően akár 98-99%-ban is eltalálják, milyen karakter állt ott eredetileg. A felhasználó fotót lát az eredetiről, ha pedig rákeres valamire, a háttérben fut le a keresés. Nem egészen jó ez, de ha nem így zajlana, soha nem jutna el senki a 60%-ig, és nem ennyi pénzből, hanem annyiból sem, amennyiért a Marsra is fel lehetne lőni egy jól kiválasztott teamet, vagy egy kisebb várost.

Az Arcanum cég, ez derült ki az idei előadásokból, ugyanezt a jól bevált eljárást, a kétszintű rendszert alkalmazza. A felhasználók többségének elégséges ez, ha pedig kutatóról van szó, az már más dolog, az többe kerülne. Mai kiépítettségében a cég heti 100 ezer oldalt fényképez le, ami hazai viszonyok között döbbenetes szám. Nagyszerű tartalmak érhetők el, döntően CD-ROM-on, DVD-n, blu-rayen (a jogdíjak miatt), intézmények, döntően könyvtárak belső hálózatában (a jogdíjak miatt), illetve az interneten is, számos különböző adatbázisban.

Amiben verhetetlenek, az az elképesztő mennyiségű adat, amelynek birtokában vannak. Amikor az elején a nézőpontról kezdtem gondolkozni, éppen ennek kapcsán merült fel bennem: idealista győzelmi beszámoló jöjjön, vagy mélyen kritikus, vagy csendesen bizakodó, kicsit bennfentes? Ugyanis olyan tárakat, adatbázisokat, kiadványokat és csak zárt hálózaton elérhető adattömeget láttam, amelyek nagy részéről talán még nem hallottam soha. Nem csak én; ahogy lemértem a körülöttem helyet foglalók arcáról, hasonlóan tágra nyílt szemmel csodálkoztunk rá például a Magyar Digitális Múzeumi Könyvtárra és társaira. Mintha az utcának, amelyben laknánk, hirtelen ledőlne az egyik oldala, és ismeretlen térség tárulna szemünk elé. Hirtelen írok (= "helyszíni beszámoló"), nem látom most pontosan a méreteket, koncepciót (ha van), azt, hogy van ez egyáltalán, de annyit megjegyeztem az Arcanum munkatársának, Somfay Örsnek prezentációjából, hogy napi 200-250 látogató is megfordulhat ebben a fantasztikus gyűjteményben.

Ami persze csak arról árulkodik, hogy az Arcanum az elmúlt években nagyszerű gyakorlatra tett szert a tartalomdigitalizásban, és talán kevésbé feladata az elkészült termékek propagálása, beépítése a köztudatba, az oktatásba, a kutatásba, akárhova.

A konferencián (mások mellett) előadást tartott a MaNDA részéről Lovas Borbála, és elhangzott a kölcsönös együttműködés szándéka.

Valóban, gondolhatjuk (talán ez a megoldás a nézőpontos dilemmára?) az egyszeri hallgató fejével: talán erre lenne leginkább szükség. Az elmúlt években keletkezett és ma is naponta, folyamatosan gyarapodó digitális kulturális tartalmak összehangolásáról. (A MaNDA munkatársa több ezer, hamarosan munkába lépő, erre dedikált közmunkásról, az Arcanum a maga részéről – ahogy már emlegettem – heti százezer oldalról beszélt a digitalizálás kapcsán.) Nehéz elhessegetni a gyanút, hogy sokszor ugyanazt a könyvet, folyóiratot, tárgyat digitalizálják több helyen, tárolják össze nem kapcsolt vagy egymáshoz nem illeszthető adatbázisokban, helyi hálózaton vagy olyan honlapokon, amelyet a józan internetfelhasználó átlagos felkészültséggel és erre szánt idővel, energiával soha el nem ér.

A MaNDA legfontosabb feladata vélhetően az legyen, gondolhatjuk még, hogy egységes (kereső)felületet szolgáltasson a bár esetlegesen keletkező, de meglévő, nagyon is sokszínű tartalmak számára, érzékelhetően gyarapítsa azokat, és azt a szakmai pluszt tegye az egész mögé, hogy a találati eredményeket ne automatikusan generált vagy kiismerhetetlen piaci szempontok szerint súlyozott sorrendben kapja a felhasználó. Feltételezem, az erről szóló előadás lelkesítően hatna azok számára is, akik megjelentek a mai programon.

M. T.

• Publikálva: 2012.04.23. 13:55 • Címke: manda, hír, digitalizálás