Detailseite
Taxon-Omics in Mikrogastroden: Auf dem Weg zu einem probabilistischen und automatischen Art-Entdeckungssystem
Antragsteller
Professor Dr. Thomas Wilke
Fachliche Zuordnung
Systematik und Morphologie der Tiere
Förderung
Förderung von 2017 bis 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 351198199
In den letzten 250 Jahren wurden ca. 1,5 Mio. Arten beschrieben, Schätzungen über die tatsächliche Artenzahl variieren jedoch zwischen 3 und 100 Mio. Einige Wissenschaftler gehen deshalb davon aus, dass viele Arten ausgerottet sind, bevor sie beschrieben werden konnten. Es ist jedoch nicht einfach, den Anteil der unbeschriebenen Arten signifikant zu verringern, da es in der Taxonomie einen grundlegenden Konflikt zwischen zwei Hauptinteressen gibt, der Qualität der Arterkennung/Artbeschreibung und der entsprechenden Rate.Ein Lösungsansatz besteht in der Integration von Museums-Informationen mit Omics-Daten und der Anwendung von Verfahren für eine (semi-) automatische Arterkennung. Mit der steigenden Fülle von genomischen Daten wurden bereits verschiedene Verfahren zur Artbestimmung entwickelt, die auf phylogenetischen oder Barcoding-Informationen basieren. Jedoch werden bisher nicht-genetische Informationen, die einen hohen diagnostischen Wert haben können, nur selten eingebunden. Probleme, die mit einem integrativen Ansatz verbunden sind, umfassen die Notwendigkeit für eine robuste phylogenetische Hypothese, den höheren rechentechnischen Aufwand, Schwierigkeiten bei der Nutzung gemischter Datentypen und die limitierte Eignung für große taxonomische Gruppen. Aufgrund dieser Limitationen von Phylogenie- oder Barcoding-basierten Systemen soll im vorliegenden Antrag ein neuartiges probabilistisches und semi-automatisches 'Species Discovery System' (proSDS) entwickelt werden. Es basiert auf einer integrierten Referenzdatenbank (anatomische, 3D-morphologische, genetische, ökologische und biogeographische Informationen) und nutzt 'supervised machine learning' Verfahren, um Arten dynamisch zu erkennen. Das Projekt hat fünf Teilziele: 1) den Aufbau einer kuratierten Referenzdatenbank, 2) das Testen verschiedener Verfahren zum effizienten Kodieren von Merkmalen, 3) das Testen von Diskriminanz-Verfahren zur Arterkennung, 4) das Testen von Verfahren zum Umgang mit fehlenden Daten und 5) die Implementierung des Ansatzes in ein öffentlich-zugängliches R-basiertes Interface (proSDS). Der proSDS-Ansatz ist in verschiedener Hinsicht innovativ. Er basiert auf integrativen Daten, kann mit fehlenden Daten und gemischten Datentypen umgehen, ist für Fossilien nutzbar, greift für bestimmte Merkmalsinformationen auf öffentliche Datenbanken zurück, nutzt neuartige Merkmalskodierungen wie bspw. die fraktale Dimension D, führt ein dynamisches Update von Merkmalswichtungen und Klassifizierungsregeln durch, und stellt dem Nutzer neben der Wahrscheinlichkeit, dass ein Abfrage-Individuum zu einer bekannten oder neuen Art gehört, auch Informationen zum individuellen Beitrag der diskriminatorischen Merkmale zur Verfügung.Dieser neue Ansatz kann prinzipiell für Taxa aus verschiedenen Reichen verwendet werden. Für die Entwicklung und das Testen des Ansatzes werden jedoch Daten aus der artenreichen und 'taxonomisch-schwierigen' Mikrogastropoden-Familie Hydrobiidae genutzt.
DFG-Verfahren
Schwerpunktprogramme
Teilprojekt zu
SPP 1991:
Taxon-OMICS: Neue Herangehensweisen zur Entdeckung und Benennung von Arten und Biodiversität
Internationaler Bezug
Brasilien
Mitverantwortlich
Professor Dr. André Backes