Digitalisierung der an der Herzog August Bibliothek befindlichen Drucke mit Helmstedter Druckort
Final Report Abstract
Mit der Digitaliserung und Erschließung von 7313 Drucken aus dem HAB Bestand der ca. 10.000 Drucke mit Helmstedter Druckort ist der überwiegende Teil der Produktion eines der wichtigsten norddeutschen Universitätsdruckorte nicht nur als Image, sondern auch als per OCR bearbeiteter Volltext verfügbar. Damit ist erstmals ein Überblick über die Druckproduktion einer bedeutenden frühneuzeitlichen Universität geschaffen, der recherchiert werden kann. Die Druckproduktion der Universität kann in besonderer Weise über universitäre und staatliche Autorisierungsmechanismen Aufschluss geben. Sie manifestiert die Paradigmen akademischen Wissens in den verschiedenen Fakultäten ebenso wie die verfolgten Lehrpraktiken, denn frühneuzeitliche Universitäten waren noch weit bis ins 18. Jh. hinein in noch stärkerem Maße als heute Unterrichts- und Ausbildungsanstalten. Sämtliche Drucke wurden katalogisiert, die Digitalisate über den OPAC, die Wolfenbütteler Digitale Bibliothek, im GBV und je nach Zugehörigkeit in den Datenbanken VD 16, VD 17 sowie über Aggregatoren wie ZVDD zugänglich gemacht. Umfangreiche Drucke wurden mit Strukturdaten erschlossen, die durch die Generierung virtueller Inhaltsverzeichnisse zu den Digitalisaten dem Nutzer ein bequemeres Navigieren im Objekt ermöglichen. Ein neuer innovativer Aspekt des Digitalisierungsprojektes war die Volltexterfassung von Drucken der frühen Neuzeit mittels OCR mit dem Ergebnis, dass alle Volltexte auf Einzeltitelebene wie auch als Gesamtkorpus durchsuchbar sind. Für Anwendungen der DH wurde ein Gesamtabzug erstellt, der heruntergeladen und frei genutzt werden kann. Dem Projekt ist es gelungen einige prinzipielle Probleme der OCR von alten Drucken zu lösen. So konnte u.a. gezeigt werden, dass die Digitalisierung von Drucken mit Mischfonts (vor allem Antiqua, Fraktur und Kursive) bei einer bisher von anderer Standardsoftware nicht erreichten Genauigkeit von durchschnittlich 96 % möglich ist. Zugleich wurden neue statistische Verfahren zur Qualitätsprüfung entwickelt, die helfen von Dienstleistern behauptete Genauigkeiten zu überprüfen.
Publications
- Volltext via OCR – Möglichkeiten und Grenzen; Testszenarien zu den Funeralschriften der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz. Mit einem Erfahrungsbericht von Thomas Stäcker aus dem Projekt „Helmstedter Drucke Online“ der Herzog August Bibliothek. Berlin 2013
Maria Federbusch, Christian Polzin