Detailseite
Entwicklung von Workflows und Softwarekomponenten zur Rettung lebenswissenschaftlicher Primärdaten
Antragsteller
Anton Güntsch
Mitantragsteller
Professor Dr. Walter Berendsohn
Fachliche Zuordnung
Evolution, Anthropologie
Ökologie und Biodiversität der Pflanzen und Ökosysteme
Ökologie und Biodiversität der Pflanzen und Ökosysteme
Förderung
Förderung von 2011 bis 2015
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 188139206
Die Frage, wie Datenrepositorien, die derzeit in veralteten Datenbanken vorgehalten werden, langfristig für eine Nachnutzung zugänglich gemacht werden können, ist ungelöst. Eine fortwährende Migration der Systeme ist nicht möglich, da sie häufig auf unbeständigen Softwareentwicklungen aufsetzen und nicht in nachhaltigen Informationsinfrastrukturen vorgehalten werden. So gehen in immer größerem Umfang Datenbestände verloren, die mit hohem Aufwand erstellt wurden und von unschätzbarem Wert für die Wissenschaft sind. Im Projekt wird ein Verfahren entwickelt, mit dem sich Primärdaten mit vertretbarem Aufwand aus überkommenen Systemen extrahieren und in Standardformate überführen lassen. In einer ersten Phase wird mit Hilfe erweiterter existierender Datenbank-Wrapper ein Vollexport des Repositoriums in einen der einschlägigen XML-Datenstandards (z.B. ABCD, DwC, SDD, TCS, EML) generiert. Die so erzeugten Exporte sind noch keine validen XML-Dokumente, da Quellkonzepte z.T. nur in nicht standardkonformen Formaten vorliegen. Im zweiten Schritt werden sie daher mit einem zu entwickelnden Werkzeug transformiert und für die Speicherung in validen XMLFiles aufbereitet, die den Kern eines Archivs für Biodiversitätsdaten bilden, das sich durch seine Standardkonformität kontinuierlich in rezente und zukünftige Formate überführen lässt. Das Verfahren ist unabhängig von der wissenschaftlichen Domäne und damit nicht nur für die Lebenswissenschaften von Bedeutung.
DFG-Verfahren
Forschungsdaten und Software (Wiss. Literaturversorgung und Informationssysteme)