Knihovna video ukázek

Anti-případová studie intranetu

Qbizm Yachting Team

Qbizm Yachting

Systém Kramerius pro tvorbu a zpřístupnění digitalizovaných dokumentů

Logo NK ČRPrůmyslové odvětví

  • Akademické instituce (archivy, knihovny, …)

Profil typického uživatele systému

  • Pracovníci Národní knihovny České republiky zajišťující služby pro vzdálené uživatele
  • Vysokoškolsky vzdělaní pracovníci vědeckých ústavů, vysokých škol a dalších institucí

Profil zákazníka

Národní knihovna České republiky (dále jen NK ČR) je největší univerzální a vědeckou knihovnou v České republice. Trvale uchovává a zpřístupňuje v úplnosti uživatelům českou knižní produkci a výběrově zahraniční odbornou literaturu.

Způsob provozu systému

Veřejně přístupná aplikace provozovaná na adrese http://kramerius.nkp.cz.

Uživatelské rozhraní

  • WWW prohlížeč

Použité technologie

  • server IBM xSeries 235 s diskovou kapacitou 3TB
  • SuSE Linux Enteprise Server
  • WWW server Apache
  • aplikační server Apache Tomcat
  • databázový server PostgreSQL
  • XML editor XMetaL Author

Partneři / subdodavatelé řešení

  • IBM, s.r.o.
  • Elsyst Engineering
  • INCAD, s.r.o.

Důvody realizace systému

Archivní noviny a další dokumenty, které není možné všem zájemcům o jejich prostudování běžným způsobem zpřístupnit/zapůjčit z důvodu degradace papíru, omezeného počtu exemplářů či jiných důvodů je možné zpřístupnit dalšími způsoby. Jednou z možností je využití technologie mikrofilmování, což je ale poměrně neefektivní a náročné řešení. Jako optimální způsob zpřístupnění jakýchkoliv archivních dokumentů se v současné době jeví využití Internetových technologií, které umožní zpřístupnit dokumenty v souladu s autorským zákonem širokému okruhu zájemců.

Popis řešení

Systém Kramerius představuje specifický typ CMS (Content Management System) jehož primárním účelem je zpřístupnění archivních a cenných dokumentů široké veřejnosti v souladu s autorským zákonem. Pro tyto účely připravil tým pracovníků NK ČR návrh struktury metadat ve formě DTD pro dokumenty typu Monografie a Periodika.

Celý systém sestává z více provázaných aplikací, které tvoří "výrobní linku" (viz. obrázek 1), v rámci které je zajištěna digitalizace dokumentů, vytváření primárních metadat pomocí OCR, následná úprava metadat a obrazových podkladů a finální zpřístupnění dokumentů pomocí WWW prohlížeče.


Obrázek č. 1

Kramerius - 'výrobní linka'


Digitalizace dokumentů je zajištěna pomocí knižního scanneru a speciálních mikrofilmových scannerů ve spolupráci s aplikací Sirius, která zajišťuje úpravy obrazových dat a následné automatizované generování XML metadat pomocí dávkových operací typu zónové rozpoznávání, zónové čtení, OCR, atd. Účelem této části celého systému je snížení nákladů na digitalizaci fondu a zefektivnění procesu digitalizace. Následná část výrobní linky slouží pro úpravu XML metadat, které jsou buď výstupem OCR z digitalizovaných dokumentů resp. primární tvorbu XML metadat pokud použití OCR není možné. Pro tvorbu a úpravu XML metadat slouží XML editor Corel XMetaL Author (dále jen XMetaL) jehož vizuální vzhled a editační vlastnosti lze upravit pro příslušné DTD takovým způsobem, že úpravu XML dokumentů může provádět i laický uživatel. XMetaL je určen pro poskytnutí snadného publikačního prostředí na bázi XMLdokumentů. XMetaL nabízí jak klasické prostředky úpravy XML dokumentů, kdy je možné dokument editovat na úrovni "zdrojového" textu, tak i v prostředí, které je vhodné pro běžné "kancelářské" uživatele zvyklé na nástroje typu MS Word (viz.obrázek 2). Pro potřeby NK ČR byla provedena přizpůsobení tohoto XML editoru pro zmíněné DTD Monografie a Periodika. Tento nástroj společně s vyvinutým přizpůsobením umožňuje nasazení i v dalších knihovních a archivních institucích, kde je možné připravovat metadata bez ohledu na systém, který je následně bude zpřístupňovat, či jinak dále zpracovávat.


Obrázek č. 2

Kramerius - prostředí pro editaci dokumnetu


Další částí "výrobní linky" je aplikace pro tzv. řízenou konverzi, která slouží pro konverzi digitalizovaných dokumentů do formátu DjVu, který je optimalizován pro archivaci obrazových předloh dokumentů. Smyslem této aplikace je poskytnout jednoduchý uživatelsky orientovaný nástroj, kterým operátor provede hromadné nastavení parametrů konverze, hromadnou konverzi obrázků, které patří k určitému dokumentu a následně může jednoduše prohlédnout a zkorigovat parametry konverze buď hromadně pro celý dokument nebo třeba pouze pro konkrétní obrazový soubor.

Aplikace pro zpřístupnění digitalizovaných dokumentů tvoří poslední článek "výrobní linky". Primárním účelem této aplikace je poskytnout intuitivní rozhraní pro uživatele ve studovnách knihovny i na Internetu pro vyhledávání potřebných informací o archivních dokumentech (metadat) i prohlížení jejich obsahu bez nutnosti fyzického přístupu k těmto dokumentům či archivním mikrofilmům. Aplikace poskytuje vlastní prostředky pro vyhledávání příslušných dokumentů, ale zároveň pro potřeby sofistikovanějšího vyhledávání obsahuje rozhraní pro nasazení znalostního vyhledávacího systému Convera RetrievalWare. Dále je aplikace obousměrně propojena s elektronickým katalogem ALEPH a systémem pro dodávání elektronických dokumentů (DoDo), který slouží pro adresné dodání elektronické verze dokumentu komukoliv na Internetu a respektuje omezení autorského zákona.


Obrázek č. 3

Systém Kramerius


Aplikace pro zpřístupnění digitalizovaných dokumentů může pracovat i ve více instancích v rámci různých institucí a poskytuje prostředky pro replikaci obsahové báze zpřístupňovaných titulů mezi těmito institucemi. Přes administrativní rozhraní aplikace lze řídit způsob replikace dat. Zároveň je možné v administrativním rozhraní spojovat a řadit jednotlivé objekty dokumentů (ročníky, stránky atd.) do větších celků, importovat/exportovat metadata a obrazová data, definovat přístupová práva k dokumentům pro aplikování autorského zákona a tak postupně budovat a spravovat kompletní obsahovou bázi zpřístupňovaných dokumentů.

Realizace projektu a popis technického řešení

Na vlastní realizaci projektu, se primárně podílel tým odborníků společnosti Qbizm technologies (hlavní kontraktor), který zajišťoval následující úkoly:

  • Analytické práce
  • Projektové řízení
  • Realizace
    • přizpůsobení XML editoru Corel XMetaL Author pro DTD Periodika a Monografie
    • aplikace pro řízenou konverzi
    • aplikace pro zpřístupnění digitalizovaných dokumentů
    • integrace se systémy třetích stran (Sirius, Convera RetrievalWare, elektronický katalog ALEPH, systém pro dodávání elektronických dokumentů)
  • Dodávka hardware
  • Zátěžové testování systému
  • Dohledování a monitorování provozu systému při ostrém nasazení
Pro realizaci aplikace pro zpřístupnění digitalizovaných dokumentů a aplikace pro řízenou konverzi bylo navrženo použití otevřených standardů, které zahrnují následující prověřené technologie:
  • J2SE (Java 2 Standard Edition)
    poskytuje základní prostředí pro běh aplikací založených na programovacím jazyce Java.
  • J2EE (Java 2 Enterprise Edition)
    poskytuje služby pro provoz robustních a škálovatelných aplikací založených na jazyce Java.
  • Databáze kompatibilní se standardem SQL
  • Operační systém na bázi UNIXu

Přínosy řešení

Systém Kramerius umožňuje využívat pro zpřístupnění archivních a vzácných dokumentů Internet, což znamená, že tyto dokumenty mohou být dostupné na více místech najednou, jsou rychle přístupné a samotné originály dokumentů není nutné používat a jsou tedy chráněny proti poškození. Systém Kramerius byl realizován v souladu s potřebou standardizace metadat pro potřeby knihoven, archivů a dalších podobných institucí. Již v tuto chvíli jsou navrženy struktury metadat pro další typy dokumentů, jako jsou muzejní objekty, a plánuje se vytvoření dalších DTD (document type definition) pro zvukové dokumenty a archiválie a jejich začlenění do systému Kramerius.

Vyhledávání

Celý intranet Aktuální oblast