Raum-zeitliche Multiskalenmerkmale zur Segmentierung und Klassifikation von Objektinstanzen in Videos

Antragsteller Professor Dr.-Ing. Thomas Brox

Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing

Förderung Förderung von 2017 bis 2021

Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 387723725

Erstellungsjahr 2021

Zusammenfassung der Projektergebnisse

In diesem gemeinsamen Projekt zwischen der Universidad de los Andes und der Universität Freiburg wurde ein Ansatz entwickelt, der auf Deep Learning basierende Instanzsegmentierung mit Bewegungsinformationen aus ebenfalls Deep-Learning basiertem optischem Fluss zusammenführt. Die Instanzsegmentierung ist für mehrere Objekte ausgelegt und hält auch eine konsistente Identität über die Zeit aufrecht. Der Ansatz kann daher auch als verfeinerter Trackingansatz betrachtet werden. Auf den DAVIS und Youtube-VOS Benchmarks zeigte das Verfahren bis dato die besten Ergebnisse bei dieser Aufgabe. Das Projekt diente primär auch der Stärkung der Zusammenarbeit zwischen der Universidad de los Andes und der Universität Freiburg sowie der Nachwuchsförderung.

Projektbezogene Publikationen (Auswahl)

MAIN: Multi-Attention Instance Network for Video Segmentation, 2019
Juan Leon Alcazar, Maria A. Bravo, Ali K. Thabet, Guillaume Jeanneret, Thomas Brox, Pablo Arbelaez, Bernard Ghanem

Servicenavigation

Hauptnavigation

Raum-zeitliche Multiskalenmerkmale zur Segmentierung und Klassifikation von Objektinstanzen in Videos

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Servicenavigation

Hauptnavigation

Raum-zeitliche Multiskalenmerkmale zur Segmentierung und Klassifikation von Objektinstanzen in Videos

Zusammenfassung der Projektergebnisse

Projektbezogene Publikationen (Auswahl)

Zusatzinformationen

Textvergrößerung und Kontrastanpassung