Detailseite
AI-GUSTUS: Eine cloud-native Pipeline für genaue Genom-Annotation
Antragstellerin
Privatdozentin Dr. Katharina Hoff
Fachliche Zuordnung
Bioinformatik und Theoretische Biologie
Förderung
Förderung seit 2024
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 552910312
Die strukturelle Annotation von protein-codierenden Genen ist ein herausforderndes Problem in eukaryotischen Genomen. Das Earth BioGenome Project (EBP) beabsichtigt, bis zu 1,7 Millionen eukaryotische Genome innerhalb dieses Jahrzehnts zu sequenzieren. Bis heute fehlt der Mehrheit der bereits existierenden eukaryotischen Genome eine Annotation der proteinkodierenden Gene, und dieses Problem wird sich um Größenordnungen verstärken, wenn die Methoden nicht verbessert werden. Dieses Forschungsprojekt zielt darauf ab, die vollautomatische strukturelle Annotation von proteinkodierenden Genen bei Eukaryoten zu verbessern, indem ein vielversprechender Deep-Learning-Ansatz mit dem etablierten Software-Framework rund um das State-of-the-Art Genvorhersage-Tool AUGUSTUS verbunden wird. Es ist zu erwarten, dass diese Verbindung einen neuen Standard in Bezug auf Genauigkeit und Flexibilität etablieren wird. Wir werden mehrere offene Probleme in den Bereichen der automatischen Zusammenstellung von ausgewogenen Trainingssätzen für Kladen, in der Integration von externer Evidenz in die Deep-Learning-Architektur und in der Vorhersage von alternativen Spleiß-Isoformen mit einem auf Deep Learning basierenden Genvorhersageprogramm angehen. Der Aufbau auf der bestehenden Codebasis von AUGUSTUS wird ein Vorteil sein, um eine Verbindung zu Werkzeugen zur Evidenzgenerierung, wie Spliced-Alignment-Tools, herzustellen. Die resultierende Software, AI-GUSTUS, wird als benutzerfreundliche Pipeline zur Verfügung stehen und somit die globale wissenschaftliche Gemeinschaft direkt in ihrer Forschung unterstützen. Mit diesem Forschungsprojekt gehe ich mehrere Herausforderungen an, die zuvor vom EBP-Komitee für Annotationsstandards identifiziert wurden. Mit der Entwicklung dieses Projekts wird die Genomannotation innerhalb und außerhalb des EBP effizienter und genauer werden. Indirekt wird dieses Projekt zur Erhaltung der Biodiversität beitragen, zur Überwachung und Verhinderung der Ausbreitung von Pathogenen und zur Verbesserung von Ökosystemdienstleistungen.
DFG-Verfahren
Sachbeihilfen