Pražská městská knihovna otevřela začátkem února nové digitalizační pracoviště v Provaznické ulici. Probíhá tam digitalizace vzácných výtisků a historických dokumentů. Úkolem digitalizace je předejít poškození vzácných výtisků čtenáři. Na naše dotazy nám odpovídala Eva Měřínská z oddělení digitalizace.
Můžete nám popsat, jak přesně probíhá digitalizace knih z pohledu používaných technologií?
Předlohy (dokumenty) skenujeme face up skenery do formátu JPG s minimální kompresí na 600 dpi. Následně jsou zpracovávány v programu Sirius od společnosti Elsyst Engineering. To se týká ořezů a úprav obrázků, tvorby metadat, vyčítání OCR a exportu do XML. Závěrem jsou tvořena administrativní metadata. Výsledek se zpřístupňuje v digitální knihovně pomocí softwaru Kramerius, který dodává společnost Qbizm, a v budocnu online přes web.
Jaké byly náklady na pořízení?
Skenujeme do softwaru příslušného ke skenerům. Program na zpracování metadat a další řešení se jmenuje Sirius. Byl vybrán na základě výběrového řízení za cenu 1 400 000 Kč, Kramerius pro zpřístupňování je freeware.
Jak probíhalo zavádění tohoto softwaru?
Vzhledem k tomu, že s oběma softwary mají zkušenost Národní knihovna ČR a Knihovna Akademie věd ČR, se kterými především v technických otázkách spolupracujeme, proběhlo a probíhá zavedení SW celkem bez problémů. Dílčí problémy jsou konzultovány s dodavateli a výrobci.
Kde a jak skladujete digitalizované texty? Jak velký úložný prostor je pro tyto digitalizované knihy vyčleněn?
Digitalizujeme obrázky, které budou archivované na třech místech (tři servery 10 TB), texty z OCR fungují pro fulltext.
Jak probíhá samotné vyhledávání v již digitalizovaných knihách?
Dle metadat a fulltextem.