Das Open-Source-Werkzeug ManuMedImporter überführt Daten aus dem HIDA-Format in das interne Kitodo-Format. Die Metadaten im HIDA-Format stammen aus dem Katalog der Manuscripta Mediaevalia. ManuMedImporter wird auf der Kommandozeile ausgeführt, findet seine Anwendung im Digitalisierungsworkflow der UB Leipzig und wurde in Java implementiert. Felix Kreißig, der Hauptentwickler von ManuMedInporter, hat uns etwas zur Software und zum Anwendungsgebiet erzählt.
Das Grundproblem
An der UB Leipzig befindet sich eines der sechs deutschen Handschriftenzentren, weswegen bei uns im Haus häufig Buchhandschriften digitalisiert werden. Für diesen Vorgang verwenden wir Kitodo, ein Werkzeug für den Digitalisierungsworkflow. Bei der Benutzung von Kitodo gab es jedoch einige Hürden zu überwinden. Zum einen bietet die Kitodo-Eingabemaske nicht die benötigten Felder für Metadaten. Zum anderen wurden die umfangreichen Metadaten bereits im Katalog der Manuscripta Mediaevalia (http://www.manuscripta-mediaevalia.de/) erfasst. Das dahinter liegende Format nennt sich HiDA (https://www.startext.de/produkte/hida). Für die Verwendung mit Kitodo müssten die HIDA-Daten nun in das Kitodo-interne Format umgewandelt werden. Die Übereinstimmung zwischen Ausgangsformat (HIDA) und Zielformat (Kitodo-intern) liegt in einer XML (Extensible Markup Language) Datei. Die jeweils verwendeten Felder sind jedoch vollkommen verschieden voneinander und waren damit nicht ohne weiteres nutzbar für uns.
Die Umsetzung
In Zusammenarbeit mit zwei Kolleg*innen (Annika Schroer kümmerte sich um das Mapping, Stefan Freitag implementierte den METS-Part) entstand eine erste Version, welche erfolgreich Metadaten überführt und eine Weiterverarbeitung in Kitodo ermöglicht. Als dann irgendwann eine Anfrage zur Benutzung des Werkzeugs von außerhalb der UB Leipzig kam, habe ich eine zweite Version entwickelt und diese auf den Github-Account der UB Leipzig hochgeladen und zur freien Nutzung verfügbar gemacht.
Wie geht’s weiter?
Momentan wird an der UB Leipzig in Kooperation mit weiteren Einrichtungen (Staatsbibliothek zu Berlin (SBB-PK), Bayerische Staatsbibliothek München (BSB), Herzog August Bibliothek Wolfenbüttel (HAB)) ein Handschriftenportal für Deutschland entwickelt. Damit ergibt sich natürlich ein potentielles Anwendungsgebiet für die Nachnutzung und Weiterentwicklung von ManuMedImporter. Aber das steht alles noch in den Sternen.
Autor: Felix Kreißig, Ronny Gey