Project Details
Entwicklung von Workflows und Softwarekomponenten zur Rettung lebenswissenschaftlicher Primärdaten
Applicant
Anton Güntsch
Co-Applicant
Professor Dr. Walter Berendsohn
Subject Area
Evolution, Anthropology
Ecology and Biodiversity of Plants and Ecosystems
Ecology and Biodiversity of Plants and Ecosystems
Term
from 2011 to 2015
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 188139206
Die Frage, wie Datenrepositorien, die derzeit in veralteten Datenbanken vorgehalten werden, langfristig für eine Nachnutzung zugänglich gemacht werden können, ist ungelöst. Eine fortwährende Migration der Systeme ist nicht möglich, da sie häufig auf unbeständigen Softwareentwicklungen aufsetzen und nicht in nachhaltigen Informationsinfrastrukturen vorgehalten werden. So gehen in immer größerem Umfang Datenbestände verloren, die mit hohem Aufwand erstellt wurden und von unschätzbarem Wert für die Wissenschaft sind. Im Projekt wird ein Verfahren entwickelt, mit dem sich Primärdaten mit vertretbarem Aufwand aus überkommenen Systemen extrahieren und in Standardformate überführen lassen. In einer ersten Phase wird mit Hilfe erweiterter existierender Datenbank-Wrapper ein Vollexport des Repositoriums in einen der einschlägigen XML-Datenstandards (z.B. ABCD, DwC, SDD, TCS, EML) generiert. Die so erzeugten Exporte sind noch keine validen XML-Dokumente, da Quellkonzepte z.T. nur in nicht standardkonformen Formaten vorliegen. Im zweiten Schritt werden sie daher mit einem zu entwickelnden Werkzeug transformiert und für die Speicherung in validen XMLFiles aufbereitet, die den Kern eines Archivs für Biodiversitätsdaten bilden, das sich durch seine Standardkonformität kontinuierlich in rezente und zukünftige Formate überführen lässt. Das Verfahren ist unabhängig von der wissenschaftlichen Domäne und damit nicht nur für die Lebenswissenschaften von Bedeutung.
DFG Programme
Research data and software (Scientific Library Services and Information Systems)