Project Details
Projekt Print View

Entwicklung von Workflows und Softwarekomponenten zur Rettung lebenswissenschaftlicher Primärdaten

Applicant Anton Güntsch
Subject Area Evolution, Anthropology
Ecology and Biodiversity of Plants and Ecosystems
Term from 2011 to 2015
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 188139206
 
Die Frage, wie Datenrepositorien, die derzeit in veralteten Datenbanken vorgehalten werden, langfristig für eine Nachnutzung zugänglich gemacht werden können, ist ungelöst. Eine fortwährende Migration der Systeme ist nicht möglich, da sie häufig auf unbeständigen Softwareentwicklungen aufsetzen und nicht in nachhaltigen Informationsinfrastrukturen vorgehalten werden. So gehen in immer größerem Umfang Datenbestände verloren, die mit hohem Aufwand erstellt wurden und von unschätzbarem Wert für die Wissenschaft sind. Im Projekt wird ein Verfahren entwickelt, mit dem sich Primärdaten mit vertretbarem Aufwand aus überkommenen Systemen extrahieren und in Standardformate überführen lassen. In einer ersten Phase wird mit Hilfe erweiterter existierender Datenbank-Wrapper ein Vollexport des Repositoriums in einen der einschlägigen XML-Datenstandards (z.B. ABCD, DwC, SDD, TCS, EML) generiert. Die so erzeugten Exporte sind noch keine validen XML-Dokumente, da Quellkonzepte z.T. nur in nicht standardkonformen Formaten vorliegen. Im zweiten Schritt werden sie daher mit einem zu entwickelnden Werkzeug transformiert und für die Speicherung in validen XMLFiles aufbereitet, die den Kern eines Archivs für Biodiversitätsdaten bilden, das sich durch seine Standardkonformität kontinuierlich in rezente und zukünftige Formate überführen lässt. Das Verfahren ist unabhängig von der wissenschaftlichen Domäne und damit nicht nur für die Lebenswissenschaften von Bedeutung.
DFG Programme Research data and software (Scientific Library Services and Information Systems)
 
 

Additional Information

Textvergrößerung und Kontrastanpassung