GDZ

Dokumenten-Server

Impressum


Bausteine für die Digitale Bibliothek: Goobi

Es gibt gute Gründe, die Retrodigitalisierung der Altbestände direkt vor Ort, also in den Bibliotheken selbst, vorzunehmen. Zu nennen sind hier: Einsparen der Transportkosten, kontrolliert pfleglicher Umgang mit gefährdeten Beständen oder schnelle Wiederverfügbarkeit am Standort. Ausschlaggebend gegenüber einer auswärtigen Lösung ist jedoch vor allem der Vorteil, bibliothekarisch erfahrenes Personal in den Digitalisierungs- und Erschließungsprozess einbinden zu können.

Gerade der inhaltlichen Erschließung der Digitalisate durch Meta- und Strukturdaten kommt eine entscheidende Bedeutung zu: Suchen im Volltext oder direkte Navigation in den (digitalen) Inhaltsverzeichnissen im Webbrowser wird erst durch Erschließung möglich. Auch die Wissenschaftsinfrastruktur der nächsten Generation (etwa: Semantic Web) ist auf Metadaten angewiesen und kann mit reinen Scan-Images nichts anfangen.

Die Digitalisierung und Erschließung der eigenen Bestände stellt Bibliotheken und Archive jedoch auch vor Probleme, vor allem organisatorischer Art. Schon ab einem mittleren Scanvolumen von mehreren Bänden pro Tag erscheint eine Aufteilung der Arbeitsschritte (etwa: Arbeitsvorbereitung, Digitalisierung, Qualitätskontrolle, Imageoptimierung, Meta- und Strukturdatenerfassung) auf verschiedene, spezialisierte Mitarbeiter sinnvoll. In Drittmittelprojekten kommt häufig erschwerend eine räumliche Komponente hinzu: unterschiedliche Arbeitsschritte werden arbeitsteilig an unterschiedlichen Standorten vorgenommen.

Um diese arbeitsteilige Produktion orts- und zeitunabhängig kontrollieren und organisieren zu können, wurde am Göttinger Digitalisierungszentrum in Kooperation mit der Abteilung Forschung und Entwicklung der Staats- und Universitätsbibliothek Göttingen (SUB) eine Workflowsoftware für digitale Bibliotheken entwickelt. Im von der DFG geförderten Projekt "RusDML" (Russian Digital Mathematics Library) mit dem Ziel, in einer zweijährigen Laufzeit ein digitales Kernarchiv russischer Zeitschriftenartikel im Fach Mathematik in der Originalsprache aufzubauen, wurde so prototypisch die verteilte Produktion von insgesamt 283.000 Seiten koordiniert.

Klicken zum Vergrößern

Die Organisation des im Screenshot skizzierten Workflows stellt an die zu verwendende Software ausgesprochen hohe Anforderungen. Das Softwarepaket für diese kooperative und kollaborative Arbeitsumgebung ist der zentrale Baustein und erfüllt folgende Funktionalitäten:

  • Plattform-Unabhängigkeit (Web-Applikation), da Partner weltweit auf das Tool zugreifen müssen
  • Zentrale Metadaten-Verwaltung, d.h. Katalogisieren und Vervollständigung der Metadaten von verschiedenen Standorten aus (zum Beispiel Erstellung der russischen Metadaten in Moskau, Transliterationen in Hannover)
  • Zentrale Verwaltung der Digitalisate (Images)
  • Import- und Exportschnittstellen für Metadaten und für Fremd-Digitalisate (zum Beispiel aus Russland)
  • Controlling-Mechanismen: welcher Partner ist wie weit mit seinen Arbeiten, welche Zeitschrift ist in welchem Bearbeitungsstadium etc.
  • Fehlermeldungen, Abschließen eines Arbeitsschrittes und Weiterleiten zur nächsten Arbeitsstufe (eventuell hier auch Wechsel/Übergabe von einem Partner zum anderen Partner)
Klicken zum Vergrößern

Komponenten für das verteilte Workflowmanagement sind integriert worden, um die Verwaltung einer verteilten Produktion und Kommunikation zwischen den unterschiedlichen Partnern zu gewährleisten. Für jeden einzelnen Workflowschritt kann eingestellt werden, ob er parallel zum vorherigen durchgeführt werden kann oder erst nach dessen erfolgreichem Abschluss. Ferner werden Korrekturschleifen abgebildet, um in späteren Schritten festgestellte fehlerhafte Daten früherer Schritte zu vermerken. Die Applikation ist transparent konzipiert, somit ist es für jeden Projektpartner jederzeit möglich, den Status der Teilschritte des Workflows inklusive Personenzuordnung für einzelne Werke detailliert einzusehen.

Mit der Vergabe persistenter URLs kann auf die freigegebenen Digitalisate referenziert werden. Zuvor werden die Dateien mit den mehrsprachigen Metadaten auf Artikelebene verknüpft, die aus den verschiedenen Datenbanken zusammengestellt werden. Das Projekt widmet sich an dieser Stelle insbesondere der Übersetzung und Transliterierung: Um einen benutzerfreundlichen Sucheinstieg zu gewährleisten, werden alle Titel in der Sprache der Vorlage und ergänzend wenigstens in englischer und/oder russischer Übersetzung angeboten. Alle Personennamen und Titel, die im Original in kyrillischer Schrift vorkommen, werden ins lateinische Alphabet transliteriert (gemäß ISO 9 und DIN 1460).

Mit dem Import in das Document Management System sind die Materialien online verfügbar.

Klicken zum Vergrößern

Die Workflowsoftware wurde von Beginn an auf möglichst große Nachnutzbarkeit hin konzipiert. Folgerichtig wird sie nunmehr für die gesamte Produktion am GDZ eingesetzt. Interessierte Nachfragen anderer Bibliotheken haben nachdrücklich das generelle Interesse an einer solchen Produktionssoftware aufgezeigt. Folgerichtig wird die Software weiterentwickelt und mit anderen Modulen – etwa der Access-Steuerung oder der Nutzungsauswertung – kombiniert.

Hierdurch entsteht eine umfassende Lösung für die Umsetzung der (Massen-) Digitalisierung unter dem Namen "Goobi" (Göttingen online-objects binaries). Das Schaubild verdeutlicht den modularen Aufbau.

Die Software wird lizenzfrei entwickelt und steht als open source zur Verfügung. Mittelfristiges Ziel ist es, eine verteilte Entwicklercommunity zu gründen, die die nachhaltige Pflege und Weiterentwicklung der Programme garantiert.

Weitere Informationen und eine Testumgebung sind unter www.goobi.org erreichbar.