Průmyslové odvětvíNárodní knihovna České republiky (dále jen NK ČR) je největší univerzální a vědeckou knihovnou v České republice. Trvale uchovává a zpřístupňuje v úplnosti uživatelům českou knižní produkci a výběrově zahraniční odbornou literaturu.
Veřejně přístupná aplikace provozovaná na adrese http://kramerius.nkp.cz.
Archivní noviny a další dokumenty, které není možné všem zájemcům o jejich prostudování běžným způsobem zpřístupnit/zapůjčit z důvodu degradace papíru, omezeného počtu exemplářů či jiných důvodů je možné zpřístupnit dalšími způsoby. Jednou z možností je využití technologie mikrofilmování, což je ale poměrně neefektivní a náročné řešení. Jako optimální způsob zpřístupnění jakýchkoliv archivních dokumentů se v současné době jeví využití Internetových technologií, které umožní zpřístupnit dokumenty v souladu s autorským zákonem širokému okruhu zájemců.
Systém Kramerius představuje specifický typ CMS (Content Management System) jehož primárním účelem je zpřístupnění archivních a cenných dokumentů široké veřejnosti v souladu s autorským zákonem. Pro tyto účely připravil tým pracovníků NK ČR návrh struktury metadat ve formě DTD pro dokumenty typu Monografie a Periodika.
Celý systém sestává z více provázaných aplikací, které tvoří "výrobní linku" (viz. obrázek 1), v rámci které je zajištěna digitalizace dokumentů, vytváření primárních metadat pomocí OCR, následná úprava metadat a obrazových podkladů a finální zpřístupnění dokumentů pomocí WWW prohlížeče.
Obrázek č. 1

Digitalizace dokumentů je zajištěna pomocí knižního scanneru a speciálních mikrofilmových scannerů ve spolupráci s aplikací Sirius, která zajišťuje úpravy obrazových dat a následné automatizované generování XML metadat pomocí dávkových operací typu zónové rozpoznávání, zónové čtení, OCR, atd. Účelem této části celého systému je snížení nákladů na digitalizaci fondu a zefektivnění procesu digitalizace. Následná část výrobní linky slouží pro úpravu XML metadat, které jsou buď výstupem OCR z digitalizovaných dokumentů resp. primární tvorbu XML metadat pokud použití OCR není možné. Pro tvorbu a úpravu XML metadat slouží XML editor Corel XMetaL Author (dále jen XMetaL) jehož vizuální vzhled a editační vlastnosti lze upravit pro příslušné DTD takovým způsobem, že úpravu XML dokumentů může provádět i laický uživatel. XMetaL je určen pro poskytnutí snadného publikačního prostředí na bázi XMLdokumentů. XMetaL nabízí jak klasické prostředky úpravy XML dokumentů, kdy je možné dokument editovat na úrovni "zdrojového" textu, tak i v prostředí, které je vhodné pro běžné "kancelářské" uživatele zvyklé na nástroje typu MS Word (viz.obrázek 2). Pro potřeby NK ČR byla provedena přizpůsobení tohoto XML editoru pro zmíněné DTD Monografie a Periodika. Tento nástroj společně s vyvinutým přizpůsobením umožňuje nasazení i v dalších knihovních a archivních institucích, kde je možné připravovat metadata bez ohledu na systém, který je následně bude zpřístupňovat, či jinak dále zpracovávat.
Obrázek č. 2

Další částí "výrobní linky" je aplikace pro tzv. řízenou konverzi, která slouží pro konverzi digitalizovaných dokumentů do formátu DjVu, který je optimalizován pro archivaci obrazových předloh dokumentů. Smyslem této aplikace je poskytnout jednoduchý uživatelsky orientovaný nástroj, kterým operátor provede hromadné nastavení parametrů konverze, hromadnou konverzi obrázků, které patří k určitému dokumentu a následně může jednoduše prohlédnout a zkorigovat parametry konverze buď hromadně pro celý dokument nebo třeba pouze pro konkrétní obrazový soubor.
Aplikace pro zpřístupnění digitalizovaných dokumentů tvoří poslední článek "výrobní linky". Primárním účelem této aplikace je poskytnout intuitivní rozhraní pro uživatele ve studovnách knihovny i na Internetu pro vyhledávání potřebných informací o archivních dokumentech (metadat) i prohlížení jejich obsahu bez nutnosti fyzického přístupu k těmto dokumentům či archivním mikrofilmům. Aplikace poskytuje vlastní prostředky pro vyhledávání příslušných dokumentů, ale zároveň pro potřeby sofistikovanějšího vyhledávání obsahuje rozhraní pro nasazení znalostního vyhledávacího systému Convera RetrievalWare. Dále je aplikace obousměrně propojena s elektronickým katalogem ALEPH a systémem pro dodávání elektronických dokumentů (DoDo), který slouží pro adresné dodání elektronické verze dokumentu komukoliv na Internetu a respektuje omezení autorského zákona.
Obrázek č. 3

Aplikace pro zpřístupnění digitalizovaných dokumentů může pracovat i ve více instancích v rámci různých institucí a poskytuje prostředky pro replikaci obsahové báze zpřístupňovaných titulů mezi těmito institucemi. Přes administrativní rozhraní aplikace lze řídit způsob replikace dat. Zároveň je možné v administrativním rozhraní spojovat a řadit jednotlivé objekty dokumentů (ročníky, stránky atd.) do větších celků, importovat/exportovat metadata a obrazová data, definovat přístupová práva k dokumentům pro aplikování autorského zákona a tak postupně budovat a spravovat kompletní obsahovou bázi zpřístupňovaných dokumentů.
Na vlastní realizaci projektu, se primárně podílel tým odborníků společnosti Qbizm technologies (hlavní kontraktor), který zajišťoval následující úkoly:
Systém Kramerius umožňuje využívat pro zpřístupnění archivních a vzácných dokumentů Internet, což znamená, že tyto dokumenty mohou být dostupné na více místech najednou, jsou rychle přístupné a samotné originály dokumentů není nutné používat a jsou tedy chráněny proti poškození. Systém Kramerius byl realizován v souladu s potřebou standardizace metadat pro potřeby knihoven, archivů a dalších podobných institucí. Již v tuto chvíli jsou navrženy struktury metadat pro další typy dokumentů, jako jsou muzejní objekty, a plánuje se vytvoření dalších DTD (document type definition) pro zvukové dokumenty a archiválie a jejich začlenění do systému Kramerius.