Detailseite
Projekt Druckansicht

Präzise und schnelle KI-basierte Methoden zur Vorhersage und Klassifizierung von strukturell aufgelösten Proteininteraktomen

Antragstellerin Dr. Katja Luck
Fachliche Zuordnung Bioinformatik und Theoretische Biologie
Förderung Förderung seit 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 551068697
 
Obwohl große Fortschritte auf dem Weg zu einer vollständigen Karte des menschlichen Protein-Protein-Interaktoms gemacht wurden, fehlen uns immer noch strukturelle Informationen für die überwiegende Mehrheit der bekannten Protein-Interaktionen, und diese machen schätzungsweise immer noch nur einen kleinen Teil des gesamten Interaktoms aus. Dieser Mangel an Wissen behindert die Erforschung zellulärer Mechanismen und die Charakterisierung von Krankheitsvarianten, und verhindert damit die Vorhersage von Phänotypen anhand von Genotypen. Proteine interagieren miteinander über eine Vielzahl unterschiedlicher Bindungsarten. Unser Verständnis der strukturellen Komplexität und der Entwicklung von Proteininteraktionsschnittstellen ist sehr unvollständig, da uns ausreichend schnelle und genaue Methoden zur Berechnung und Klassifizierung von Ähnlichkeiten zwischen Interaktionsschnittstellen fehlen. Wir schlagen vor, neue schnelle und genaue, auf künstlicher Intelligenz basierende Methoden zur Vorhersage von Protein-Protein-Interaktionen (PPI) mit struktureller Auflösung und zur Berechnung von PPI-Schnittstellenähnlichkeiten zu entwickeln. Diese Methoden werden uns ermöglichen strukturell vollständig aufgelöste Protein-Interaktome und vollständige strukturelle Verzeichnisse von Proteinbindungsarten zu erstellen. Wir werden die Genauigkeit und Geschwindigkeit von AlphaFold-Multimer (AF-MM) für PPI-Vorhersagen verbessern, indem wir metagenomische Sequenzinformationen, ein von PPI-Schnittstellen geleitetes Selbst-Destillationstraining und Architekturanpassungen zur Beschleunigung der Inferenz entwickeln werden. Wir werden Foldseek so anpassen, dass es schnelle und genaue PPI-Schnittstellen-Ähnlichkeitsberechnungen durchführt, die es uns ermöglichen, alle Vergleiche von strukturell aufgelösten PPI-Schnittstellen aus der PDB durchzuführen. Dies wird zu Clustern von ähnlich strukturierten Schnittstellen führen, unabhängig von der Proteinsequenz, der Faltung oder der modularen Proteinarchitektur. Wir werden unser verbessertes AF-MM-Modell verwenden, um die Strukturen von 15 Millionen potentiellen PPIs im menschlichen Proteom vorherzusagen und diese Vorhersagen nach mutmaßlich neuen PPI-Schnittstellentypen durchsuchen. Wir werden die vorhergesagten PPIs mit krankheitsassoziierten Mutationen integrieren, um wahrscheinliche krankheitsrelevante neue Schnittstellenvorhersagen zu identifizieren. Diese werden dann experimentell validiert. Die erzeugten Datensätze werden über spezielle Web-Ressourcen verbreitet und zur Vorhersage größerer Proteinkomplexe, zur Untersuchung von Mustern konvergenter PPI-Schnittstellenevolution und zur Unterstützung der Charakterisierung von Krankheitsvarianten genutzt. Die entwickelten Methoden und Ressourcen werden eine Vielzahl von Forschungsarbeiten im Bereich der Proteininteraktome ermöglichen und unterstützen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Südkorea
Kooperationspartner Professor Dr. Martin Steinegger
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung