Detailseite
Kombinatorische Methoden zur verbesserten Identifikation von Orthologen in großen Datensätzen
Antragsteller
Professor Dr. Peter Florian Stadler
Fachliche Zuordnung
Bioinformatik und Theoretische Biologie
Mathematik
Mathematik
Förderung
Förderung seit 2020
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 432974470
Die Identifikation von Orthologen ist ein wichtiger Schritt bei Genomannotationen, Benennung von Genen sowie zum Verständnis von Genevolution. Durch das rasant zunehmende Tempo, mit dem neue Genome verfügbar werden, werden hocheffiziente Methoden zur Orthologenidentifikation dringend benötigt. In der Literatur wurdebereits gezeigt, dass beidseitige beste Hits („Reciprocal Best Match“) Methoden -- auch für große Datenmengen -- halbwegs genau sind. Dennoch sind sie weit von Perfektion entfernt und sowohl für falsch-positive als auch für falsche negative Orthologiesignaleanfällig. Basierend auf jüngsten Fortschritten in der phylogenetischen Kombinatorik schlagen wir vor, praktische Methoden zu entwickeln, um von gegenseitigen besten Hits (gemessen an Sequenz(un)ähnlichkeit) die gegenseitig am nächsten verwandten Sequenzen zu bestimmen, d.h., die besten Hits im eigentlichen evolutionären Sinne; diese stehen in direktem Bezug zur Orthologie. Das Ziel des vorgeschlagenen Projekts ist dieEntwicklung einer Softwarebibliothek, die diese Art von Datenkorrektur vornimmt, nicht nur für den Fall von Duplikats-Verlust Szenarien („duplication-loss scenarios“) sondern auch in der Gegenwart von horizontalem Gentransfer. Zu diesem Zweck werden wir neueste mathematische Erkenntnisse über Orthologie, Übereinstimmungsabbildungen(„reconciliation maps“) zwischen Gen- und Speziesbäumen sowie der Bestimmung evolutionärer Ereignisse nutzen. Anstatt ein weiteres Werkzeug zur Identifikation von Orthologen zu forcieren, werden wir uns darauf konzentrieren, eine Open Source Softwarebibliothek zu implementieren und der wissenschaftlichen Gemeinschaft bereitzustellen, sodass diese die neuen Algorithmen leicht in ihre Pipelines und Software-Tools integrieren kann. Als eine beispielhafte Anwendung werden wir ein neues Backend für ProteinOrtho entwickeln, ein Werkzeug zur Identifikation von Orthologie, welches von der Lechner Gruppe in Marburg gewartet wird.
DFG-Verfahren
Sachbeihilfen