Detailseite
Projekt Druckansicht

Modellbildung aus Experimentaldaten: Maschinelles Lernen und Modellevaluierung unter Abhängigkeiten und Verteilungsverschiebungen

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2012 bis 2024
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 225197905
 

Zusammenfassung der Projektergebnisse

Das Projekt untersucht und entwickelt Methoden des maschinellen Lernens für Daten, die durch besondere Verteilungseigenschaften geprägt sind. Traditionell wird in den meisten methodischen Ansätzen des maschinellen Lernens unterstellt, dass Datenpunkte unabhängige Stichproben aus einer einheitlichen Verteilung darstellen (englisch i.i.d., für independently drawn from identical distributions). Aufgrund spezifischer experimenteller Beobachtungsprozesse können Daten diese Annahme aber in verschiedener Weise verletzen. Im Projekt fokussieren wir uns auf zwei spezifische Verteilungseigenschaften: (1) Abhängigkeiten zwischen Datenpunkten, die durch individuelle Effekte von z.B. Versuchspersonen entstehen; (2) Verteilungsverschiebungen innerhalb der Daten, die z.B. durch an unterschiedlichen Orten durchgeführte Messungen entstehen. Zur Untersuchung dieser Phänomene fokussiert das Projekt auf zwei Anwendungsdomänen, in denen die entsprechenden Verteilungseigenschaften in charakteristischer Weise auftreten: (1) Blickbewegungsdaten in der Psychologie, welche stark durch individuelle Effekte geprägt sind sowie (2) Bodenbewegungsdaten in der seismischen Risikoanalyse, in denen räumliche Verteilungsverschiebungen durch unterschiedlicher Messstandorte eine große Rolle spielen. Zentrale Ergebnisse des Projekts im Bereich individueller Effekte sind Modelle zur Charakterisierung individueller Verteilungen in Sequenzdaten, von vollständig probabilistischen Modellen über Kombinationen von probabilistischen Modellen mit neuronalen Netzen bis zu Modellen, die auf Ansätzen des Metriklernens basieren. Auf der Anwendungsseite konnten wir zeigen, dass Blickbewegungsmuster hochgradig individuell sind, und daher auch zur biometrischen Identifikation von Personen dienen können. Dabei konnten wir die Erkennungsgenauigkeit im Vergleich zu existierenden Ansätzen aus der Literatur erheblich steigern. Zentrale Ergebnisse des Projekts im Bereich Verteilungsverschiebungen sind Modelle, die kontinuierliche räumliche Verteilungsverschiebungen in Daten abbilden. Dabei beschreibt ein Gauß’scher Prozess die räumliche Veränderung von Modellparametern, die ihrerseits den Zusammenhang zwischen Eingaben (z.B. Erdbebenattribute) und Ausgaben (z.B. Bodenbewegung) beschreiben. Auf der Anwendungsseite konnten wir zeigen, dass solche Modelle deutlich präzise Vorhersagen der Bodenbewegung liefern als i.i.d.-Modelle.

Projektbezogene Publikationen (Auswahl)

  • A Model of Individual Differences in Gaze Control During Reading. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) (2014), 1810-1815. Association for Computational Linguistics.
    Landwehr, Niels; Arzt, Sebastian; Scheffer, Tobias & Kliegl, Reinhold
  • A Nonergodic Ground‐Motion Model for California with Spatially Varying Coefficients. Bulletin of the Seismological Society of America, 106(6), 2574-2583.
    Landwehr, Niels; Kuehn, Nicolas M.; Scheffer, Tobias & Abrahamson, Norman
  • A Semiparametric Model for Bayesian Reader Identification. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (2016), 585-594. Association for Computational Linguistics.
    Abdelwahab, Ahmed; Kliegl, Reinhold & Landwehr, Niels
  • Varying-coefficient models for geospatial transfer learning. Machine Learning, 106(9-10), 1419-1440.
    Bussas, Matthias; Sawade, Christoph; Kühn, Nicolas; Scheffer, Tobias & Landwehr, Niels
  • A Discriminative Model for Identifying Readers and Assessing Text Comprehension from Eye Movements. Lecture Notes in Computer Science (2019), 209-225. Springer International Publishing.
    Makowski, Silvia; Jäger, Lena A.; Abdelwahab, Ahmed; Landwehr, Niels & Scheffer, Tobias
  • Detecting Autism by Analyzing a Simulated Social Interaction. Lecture Notes in Computer Science (2019), 193-208. Springer International Publishing.
    Drimalla, Hanna; Landwehr, Niels; Baskow, Irina; Behnia, Behnoush; Roepke, Stefan; Dziobek, Isabel & Scheffer, Tobias
  • Probabilistic Seismic Hazard Analysis in California Using Nonergodic Ground Motion Models. Bulletin of the Seismological Society of America, 109(4), 1235-1249.
    Abrahamson, Norman; Kuehn, Nicolas; Walling, Melanie & Landwehr, Niels
  • How the Selection of Training Data and Modeling Approach Affects the Estimation of Ammonia Emissions from a Naturally Ventilated Dairy Barn—Classical Statistics versus Machine Learning. Sustainability, 12(3), 1030.
    Hempel, Sabrina; Adolphs, Julian; Landwehr, Niels; Janke, David & Amon, Thomas
  • Quantile Layers: Statistical Aggregation in Deep Neural Networks for Eye Movement Biometrics. Lecture Notes in Computer Science (2020), 332-348. Springer International Publishing.
    Abdelwahab, Ahmed & Landwehr, Niels
  • Supervised Machine Learning to Assess Methane Emissions of a Dairy Building with Natural Ventilation. Applied Sciences, 10(19), 6938.
    Hempel, Sabrina; Adolphs, Julian; Landwehr, Niels; Willink, Dilya; Janke, David & Amon, Thomas
  • Towards the automatic detection of social biomarkers in autism spectrum disorder: introducing the simulated interaction task (SIT). npj Digital Medicine, 3(1).
    Drimalla, Hanna; Scheffer, Tobias; Landwehr, Niels; Baskow, Irina; Roepke, Stefan; Behnia, Behnoush & Dziobek, Isabel
  • Deep Distributional Sequence Embeddings Based on a Wasserstein Loss. Neural Processing Letters, 54(5), 3749-3769.
    Abdelwahab, Ahmed & Landwehr, Niels
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung