Detailseite
Projekt Druckansicht

Lernen aus hochdimensionalen, heterogenen Daten: Maschinelle Lernmethoden in der Ökonometrie

Fachliche Zuordnung Statistik und Ökonometrie
Förderung Förderung von 2020 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 431701914
 
Durch die fortschreitende Digitalisierung stehen heute große Datensätze mit vielen möglichen Variablen für verschiedene Bereiche des menschlichen Verhaltens zur Verfügung. Daten aus mikroökonomischen Anwendungen zeigen oft Heterogenität in Bezug auf Datenquellen, Endogenität relevanter Variablen und zunehmender Datendimension. Die Analyse großer Mengen hochdimensionaler Daten aus diesem Bereich erfordert daher maßgeschneiderte maschinelle Lernmethoden. In diesem Projekt wollen wir maschinelle Lernmethoden für heterogene Treatmenteffekte in randomisierten Experimenten sowie für Heterogenität in Random-Coefficient-Regressionsmodellen in der Nachfrageschätzung entwickeln und erweitern. In diesem Rahmen werden wir den Least Absolute Shrinkage and Selection Operator (LASSO), die adaptive Version des LASSO, die kausale Version der Random-Forest-Methodik sowie Boosting untersuchen. Ein Schwerpunkt liegt auf der Analyse der Variablen-Selektionseigenschaften dieser Methoden, teilweise in Kombination mit der kürzlich eingeführten Knockoff-Methode zur Kontrolle der False Discovery Rate. Auf der methodischen Seite werden wir theoretische Garantien für die vorgeschlagenen Methoden entwickeln und effiziente Wege zur Erzeugung von Knockoff-Variablen untersuchen. Auf der angewandten Seite werden wir die Methoden in frei verfügbaren Softwarepaketen implementieren, und wir werden sie auf Datensätze aus der Nachfrageschätzung sowie auf randomisierte Experimente anwenden.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug China, Großbritannien, USA
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung