Detailseite
Projekt Druckansicht

Trainieren tiefer Netzwerke für reale Computer Vision Szenarien mithilfe gerenderter Daten

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2018 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 401269959
 
Das Lernen von Computer Vision Aufgaben mittels tiefer neuronaler Netzwerk benötigt große Datenmengen, um die volle Leistungsfähigkeit des Ansatzes auszureizen. Für einige Computer Vision Aufgaben, wie Bewegungsschätzung oder Tiefenschätzung, ist es jedoch unmöglich, entsprechend große Datenmengen durch manuelle Annotation realer Bilddaten zur Verfügung zu stellen. Eine Möglichkeit stellen synthetische, gerenderte Bilddaten dar. In diesem Fall werden neben den Eingangsbildern, auch die gewünschten Ausgaben gerendert und stehen so für den Trainingsprozess zur Verfügung. Am Ende soll das Netzwerk jedoch gute Ergebnisse auf Realdaten produzieren. In diesem Projekt möchten wir daher Verfahren entwickeln, mit denen sich Netzwerke auf synthetischen Daten trainieren lassen, jedoch auch auf Realdaten optimale Ergebnisse erzielen können. Hierbei werden wir insbesondere Verfahren entwickeln, die neben den annotierten synthetischen Bilddaten nichtannotierte Realdaten in den Trainingsprozess integrieren. Das Hauptaugenmerk liegt auf der Bewegungsschätzung und der Tiefenschätzung aus Videos. Daneben möchten wir untersuchen, inwieweit sich die erarbeiteten Konzepte auch im Bereich bildbasierte Kontrolle einsetzen lassen.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung