Digitisation / Cataloguing of non-textual objects: Development of a subject indexing system for collections of the north hemispherical flowering plant genus Campanula
Final Report Abstract
Ausgangspunkt des Projektes war die Einsicht, dass in der biologischen Systematik die Sammlungserschließung und der Forschungsprozess stärker zusammengedacht werden müssen. Forschungsobjekte der biologischen Systematik sind Belege (Specimens) und Proben von Belegen organismischer Individuen als Vertreter von Taxa. Belege konserviert als Sammlungsobjekte garantieren, dass die Forschungsergebnisse überprüfbar und reproduzierbar sind. Dabei bedient sich der Forschungsprozess nicht nur der Objekte von Sammlungen, sondern sammelt selbst Objekte für seine Untersuchungen. Die fragile dauerhafte Dokumentation des Zusammenhangs von Organismus, Beleg, Probe und darauf basierenden Forschungsdaten ist die immanente Verbindung des Forschungsprozesses mit den Sammlungen und ihrer Erschließung. Für eine effiziente nachhaltige Dokumentation dieses Zusammenhangs wurde im Projekt auf der „EDIT (European Distributed Institute of Taxonomy) Platform for Cybertaxonomy“, einer umfassenden Software-Umgebung zur Handhabung und Publikation taxonomischer Daten, ein Workflow zur Objekterschließung im Forschungsprozess implementiert. Mit diesem kann die Verknüpfung organisiert werden zwischen (a) untersuchten Proben organismischer Individuen, (b) den zu diesen Individuen in Forschungssammlungen deponierten oder zu deponierenden Belegen, (c) den aus Belegen und Proben erhaltenen Forschungsdaten sowie (d) den Taxon-Zuordnungen („Identifikationen“) dieser Individuen. Die realisierte Objekterschließung im Forschungsprozess basiert auf fünf Prinzipien: (1) Belegdaten können neu eingegeben oder zur Vervollständigung der Erschließung editiert (etwa georeferenziert) werden. (2) das Verhältnis von Belegen und Proben ist als editierbare Derivationshierarchie implementiert. (3) Beleg mitsamt ihrer Derivationshierarchie können den Taxa einer Klassifikation zugeordnet werden. (4) Forschungsdaten, die aus der Untersuchung von Elementen der Derivationshierarchie gewonnen werden, lassen sich mit den jeweiligen Derivaten verknüpfen. (5) Die Metadaten zu Belegen, Proben, der Derivationshierarchie und den verknüpften Forschungsdaten können mittels Standardaustauschprotokollen für Belegdaten importiert und exportiert werden. Neue, editierte und angereicherte Datensätze können so den Sammlungen zum Import in ihre Datenbanken zur Verfügung gestellt werden. Die Objekterschließungen lassen sich in einem Datenportal der EDIT-Plattform visualisieren. Im Projekt wurde die Objekterschließung exemplarisch mit Forschungen an der Gattung Campanula getestet. Zur Visualisierung wurde ein Datenportal zu Campanula (Gattung der Glockenblumen) unter http://campanula.e-taxonomy.net/ aufgesetzt. Vorteile dieses Workflows: (1) Forschungsdaten können direkt mit individuellen Belegen verknüpft werden. (2) Strukturierte Organisation von Untersuchungsobjekten (Derivationshierarchie) mit den verknüpften Forschungsdaten kann direkt an Sammlungen übergeben werden. (3) Bisher nur ausnahmsweise in Sammlungen vertretene digitale Objekte (z.B. Rasteraufnahmen) können leicht Belegdigitalisaten zugeordnet werden. (3) Belege in Sammlungen können Zugriffspunkte für belegbasierte Forschungsdaten werden. (4) Zugänglichkeit belegbasierter Forschungsdaten ermöglicht echte Additivität von Daten in der taxonomischen Forschung.
Publications
- 2014: LibrAlign – A GUI library for displaying and editing multiple sequence alignments and attached data. – Konferenz BioDivEvo 2014, Dresden, 2014
Stöver B. C. & Müller K. F.
- 2015: LibrAlign – A powerful Java GUI library for MSA and attached raw and meta data. Poster (& Abstract) auf dem IPAM Multiple Sequence Alignment Workshop; Los Angeles, USA, 2015
Stöver B. C. & Müller K. F.
- 2015: Neues Sample-Modul für Cybertaxonomie: Ein Workflow für integratives Probendatenhandling. – GfBS News 31: 30-31
Henning T., Plitzner P. & Kilian N.
- 2015: Sample data processing in an additive and reproducible taxonomic workflow by using character data persistently linked to preserved individual specimens. – Database 2015: bav094
Kilian N., Henning T., Plitzner P., Müller A., Güntsch A., Stöver B. C., Müller K. F., Berendsohn W. G., Borsch T.
(See online at https://academic.oup.com/database/article/doi/10.1093/database/bav094/2433226) - 2015: Sample data processing in an additive and reproducible taxonomic workflow. – Vortrag im Rahmen der Internationalen Konferenz „Caryophyllales 2015“ am BGBM, Berlin, 16. September 2015
Henning T., Plitzner P.& Kilian N.