Detailseite
Erwartungswerte und mehr: Methoden zur Regression von Verteilungsfunktionen in der Epidemiologie und Biostatistik
Antragsteller
Professor Dr. Torsten Hothorn
Fachliche Zuordnung
Epidemiologie und Medizinische Biometrie/Statistik
Förderung
Förderung von 2012 bis 2018
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 225384399
Das prinzipielle Ziel einer Regressionsanalyse ist die Beschreibung derbedingten Verteilung einer Zielgröße gegeben eine Menge von potenziellenEinflußgrößen. Dieses Ziel wird in der Praxis jedoch selten erreicht,stattdessen wird nur der Erwartungswert dieser eigentlich interessierendenVerteilung als Funktion der Einflußgrößen beschrieben. Es wird in der Regelangenommen, daß höhere Momente der bedingten Verteilung, wie etwa Varianz, Schiefe oder Wölbung, nicht von den Einflußgrößen abhängen. So ist es etwaproblematisch anzunehmen, daß Risikofaktoren für den mittlerenErnährungszustand von Kindern auch als Risikofaktoren für Unterernährunginterpretiert werden können. Unterernährung ist definiert über die unterenQuantile der Ernährungsverteilung und es ist unrealistisch, diese alseinfache Verschiebung des Mittelwertes zu modellieren. Die häufigangewandte Modellvereinfachung der Additivität von Signal und Fehlertermenist ursächlich für Modellannahmen wie etwa Varianzhomogenität oderSymmetrie. Wir schlagen in diesem Projektantrag vor, in der Klasse derTransformationsmodelle die Annahme der Additivität von Signal und Fehlerfallen zu lassen und eine neue Klasse von semiparametrischenRegressionsmodellen zu betrachten, in der auch höhere Momente der bedingtenVerteilung der Zielgröße von Einflußfaktoren abhängen dürfen. Für die Schätzung dieser Modelle schlagen wir vor, sogenannte ``scoring rules'',welche für die Beurteilung der Qualität von probabilistischen Aussagenverbreitet sind, als Verlustfunktionen einzusetzen.Die daraus resultierenden Modelle sind vielversprechend für die Lösung von Problemen in der Epidemiologie und der Biostatistik, insbesondere für die Beschreibung von Varianzheterogenität, für den räumlichen Vergleich von Verteilungen, für die Identifikation von extremen Ereignissen, für dieHerleitung von Prognoseintervallen und die über Mittelwertseffektehinausgehende Variablenselektion.Mit diesem Antrag verfolgen wir drei Hauptziele, nämlich die Evaluation vonverschiedenen Optimierungstechniken für die Modellschätzung hinsichtlich derGüte der resultierenden geschätzten bedingten Verteilungsfunktionen, die Erweiterung des Basismodells auf zensierte Zielgrößen und damit zu Modellen,welche eine Abhängigkeit der Variabilität einer zensierten Zielgröße von denEinflußgrößen zuläßt sowie den praktischen Einsatz der erarbeiteten Methodikfür die Modellierung von kindlicher Unterernährung und von Geburtsgewichten.Inbesondere in diesen beiden Anwendungen führt die Mittelwertsregression zueiner nicht adäquaten Vereinfachung, welche der zugrundeliegendenFragestellung nicht mehr gerecht wird, da ja Verteilungsaussagen, wie etwadie Beschreibung von Unterernährung über die unteren Quantile desErnährungszustandes oder die Herleitung von Vorhersageintervallen stattPunktprognosen für Geburtsgewichte, die eigentlichen inhaltlich wichtigenZiele darstellen.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Schweiz
Beteiligte Personen
Professor Dr. Peter Bühlmann; Professor Dr. Thomas Kneib; Professor Dr. Matthias Schmid