Trainieren tiefer Netzwerke für reale Computer Vision Szenarien mithilfe gerenderter Daten

Antragsteller Professor Dr.-Ing. Thomas Brox

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing

Förderung Förderung von 2018 bis 2023

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 401269959

Projektbeschreibung

Das Lernen von Computer Vision Aufgaben mittels tiefer neuronaler Netzwerk benötigt große Datenmengen, um die volle Leistungsfähigkeit des Ansatzes auszureizen. Für einige Computer Vision Aufgaben, wie Bewegungsschätzung oder Tiefenschätzung, ist es jedoch unmöglich, entsprechend große Datenmengen durch manuelle Annotation realer Bilddaten zur Verfügung zu stellen. Eine Möglichkeit stellen synthetische, gerenderte Bilddaten dar. In diesem Fall werden neben den Eingangsbildern, auch die gewünschten Ausgaben gerendert und stehen so für den Trainingsprozess zur Verfügung. Am Ende soll das Netzwerk jedoch gute Ergebnisse auf Realdaten produzieren. In diesem Projekt möchten wir daher Verfahren entwickeln, mit denen sich Netzwerke auf synthetischen Daten trainieren lassen, jedoch auch auf Realdaten optimale Ergebnisse erzielen können. Hierbei werden wir insbesondere Verfahren entwickeln, die neben den annotierten synthetischen Bilddaten nichtannotierte Realdaten in den Trainingsprozess integrieren. Das Hauptaugenmerk liegt auf der Bewegungsschätzung und der Tiefenschätzung aus Videos. Daneben möchten wir untersuchen, inwieweit sich die erarbeiteten Konzepte auch im Bereich bildbasierte Kontrolle einsetzen lassen.

DFG-Verfahren Sachbeihilfen

Servicenavigation

Hauptnavigation

Trainieren tiefer Netzwerke für reale Computer Vision Szenarien mithilfe gerenderter Daten

Zusatzinformationen

Servicenavigation

Hauptnavigation

Trainieren tiefer Netzwerke für reale Computer Vision Szenarien mithilfe gerenderter Daten

Zusatzinformationen

Textvergrößerung und Kontrastanpassung