Detailseite
Beherrschbare Neuro-Kausale Modelle
Antragsteller
Professor Dr. Kristian Kersting
Fachliche Zuordnung
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung seit 2025
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 545991504
Forschungskontext. Deep Learning, die wichtigste treibende Kraft hinter der künstlichen Intelligenz (KI), leidet unter Datenmangel, mangelnder Interpretierbarkeit und Erklärbarkeit sowie der Anfälligkeit für gegnerische Angriffe und Abkürzungslernen. Ein prinzipieller Ansatz zur Überwindung dieser Schwächen ist die kausale Modellierung und Inferenz, ein mathematischer Rahmen, der der menschlichen Kognition sehr ähnlich ist. Die Verbindung von Kausalität und Deep Learning wurde als einer der vielversprechendsten Wege zu einer vertrauenswürdigen und menschengerechten KI identifiziert. Eine echte Kombination von Kausalität und Deep Learning stellt jedoch aufgrund ihrer grundlegend unterschiedlichen Herangehensweise an die Inferenz erhebliche computationale Herausforderungen dar. Insbesondere die kausale Inferenz erfordert probabilistische Inferenz als Unterprogramm, was ein notorisch schwieriges Problem darstellt. Zielsetzungen. Unser übergeordnetes Ziel ist es, Modelle zu entwickeln, die tiefes Lernen mit prinzipiellem kausalem Schlussfolgern kombinieren, um einen großen Schritt in Richtung skalierbarer neurokausaler KI-Systeme zu machen, die ausdrucksstark, robust und vertrauenswürdig sind. Ein besonderer Schwerpunkt in diesem Projekt liegt auf der rechnerischen Herausforderung der Inferenz. Im Gegensatz zu bestehenden neurokausalen Modellen, die in der Regel auf approximativer probabilistischer Inferenz beruhen, werden wir unsere Modelle auf nachvollziehbaren probabilistischen Schaltkreisen (PCs) aufbauen, die probabilistische Inferenz exakt und effizient durchführen. Die Hauptziele sind (i) die Verallgemeinerung von PCs auf den kausalen Bereich, was zu sogenannten kausalen Schaltkreisen (CCs) führt, und (ii) die Kombination von CCs mit probabilistischen Deep-Learning-Modellen über hybride Inferenzverfahren. Herangehensweise. Um CCs zu etablieren, werden wir zunächst strukturelle kausale Modelle (SCMs) durch Kompilierung übernehmen, d.h. wir werden SCMs in nachvollziehbare Schaltkreise umwandeln und kausale Inferenz innerhalb dieser untersuchen. Im Gegensatz zu bestehenden Ansätzen, die auf diskrete Daten beschränkt sind, werden unsere Kompilationsmethoden auch mit kontinuierlichen Daten umgehen können. Darüber hinaus werden wir Algorithmen entwickeln, um CCs direkt aus Daten zu lernen und sie als "erstklassiges" Kausalmodell zu untersuchen, das SCMs verallgemeinert. Um CCs mit Deep-Learning-Modellen zu verbinden, werden wir auf neuen hybriden probabilistischen Inferenztechniken aufbauen, um exakte CC-Inferenz mit approximativer Inferenz in probabilistischen Deep-Learning-Systemen zu kombinieren.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Österreich
Kooperationspartner
Professor Dr. Robert Peharz