Detailseite
Lifespan AI - Projekt C2: Kausale Modellierung im Lebenslauf
Antragstellerinnen
Professorin Dr. Vanessa Didelez; Professorin Dr. Iris Pigeot
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung seit 2022
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 459360854
Unser Projekt hat zum Ziel, innovative und robuste Ansätze zu entwickeln, um mit Hilfe neuer Methoden der künstlichen Intelligenz kausale Zusammenhänge im Lebenslauf aufzudecken und zu quantifizieren. Solche Ansätze werden dringend benötigt, da randomisierte Studien, die als Goldstandard der kausalen Inferenz gelten, für langfristige Fragestellungen über den gesamten Lebenslauf, wie z.B. zur Abschätzung der Auswirkungen des Lebensstils in der Kindheit auf die Gesundheit im Erwachsenenalter, so gut wie nicht existieren. “Causal discovery” (kausale Modellselektion) bezeichnet eine Klasse von Methoden, die von einem multivariaten Datensatz ausgehen (Input) und im Idealfall einen gerichteten azyklischen Graphen ausgeben (Output), der die probabilistische kausale Struktur zwischen den Variablen (als Knoten im Graph) darstellt. Solche Methoden werden zwar allmählich auch im biomedizinischen und sozialwissenschaftlichen Bereich angewandt, aber es gibt bisher keine Beispiele dafür, dass mehrere zeitlich strukturierte Datensätze kombiniert wurden, um eine große Spanne im Lebenslauf abzudecken – unser Vorhaben wird diese Lücke schließen.Das Projekt wird zunächst die theoretische Grundlage für unsere Forschung legen, indem ein kausaler Selektionsalgorithmus entwickelt wird, der zeitlich strukturierte Datensätze kombinieren kann, so dass eine große Spanne im Lebenslauf abgedeckt werden kann, und der sowohl nachweislich korrekt und vollständig sowie praktisch nützlich ist, und zwar den sogenannten TIOD Algorithmus – “temporal integration of overlapping datasets”. Des Weiteren werden wir moderne maschinelle Lernverfahren hinzuziehen (z.B. „causal generative neural networks“), damit der TIOD Algorithmus auch für Situationen geeignet ist, die nicht-lineare und nicht-parametrische Modellierungen erfordern. In diesem Zusammenhang muss ein besonderer Fokus auf die Rolle von Studiendesigns für Multi-Kohorten gelegt werden, da manche Designs informativer sein können als andere. Zudem werden wir Methoden zur Quantifizierung kausaler Beziehungen, wie sie von TIOD gefunden werden, auf den Fall verallgemeinern, dass auch langfristige Effekte aus getrennten Datenquellen geschätzt werden können. Um unseren methodischen Ansatz zu validieren und die praktische Nützlichkeit zu demonstrieren, werden wir im Verlauf des Projekts relevante epidemiologische Forschungsfragen eruieren und entsprechende Datensätze aufbereiten, z.B. indem wir die IDEFICS/I.Family Kohortenstudie und die NAKO Gesundheitsstudie kombinieren. Hierbei wird die Datenharmonisierung eine eigene Herausforderung darstellen. Die Anwendung von TIOD auf diese Daten soll letztlich neue Einsichten liefern, z.B. in die kausalen Zusammenhänge zwischen Faktoren in der Kindheit und Gesundheit im Erwachsenenalter.
DFG-Verfahren
Forschungsgruppen