Detailseite
Projekt Druckansicht

Gewinnung und Bewertung von raumbezogenen Referenzdaten durch bezahltes Crowdsourcing zur effizienten Trainingsdatengewinnung für Deep Learning Systeme

Fachliche Zuordnung Geodäsie, Photogrammetrie, Fernerkundung, Geoinformatik, Kartographie
Förderung Förderung seit 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 501973633
 
Derzeit werden große Anstrengungen unternommen, Deep-Learning-Systeme wie Convolutional Neural Networks (CNN) auch auf Fernerkundungsbildern anzuwenden. Aufgrund der Besonderheiten von Fernerkundungsbildern sind jedoch Standard-CNNs für deren Analyse nur begrenzt geeignet. Es wäre wünschenswert, spezialisierte CNNs von Grund auf zu trainieren, aber dies ist bislang aufgrund des Mangels an hinreichend großen Mengen annotierter Trainingsdaten nicht möglich. Crowdsourcing bietet eine effektive Methode zur Bereitstellung solcher Daten, was zu einem zunehmenden Interesse an der Nutzung dieser Methode zur Gewinnung von raumbezogenen Daten aus Fernerkundungsbildern geführt hat. Allerdings setzt sich die Crowd aus Menschen mit sehr unterschiedlichem Hintergrund zusammen, die meist nicht mit den Standards der Geodatenerfassung vertraut sind. Daher muss man mit Ergebnissen von sehr heterogener Qualität rechnen.Das Ziel dieses Projektes ist es, mittels bezahltem Crowdsourcing qualitative hochwertige Trainingsdaten aus Fernerkundungsbildern zu gewinnen. Aufwendige manuelle Kontrollen sollen entfallen, und zwar auch bei fehlenden Referenzdaten. Hierzu schlagen wir einen datengetriebenen Ansatz vor, der auf einer mehrfachen Datenerfassung basiert, um die geometrische Qualität der erfassten Daten zu beschreiben und zu verbessern. Zunächst definieren wir ein integriertes Qualitätsmaß, dass Ähnlichkeitsmaße zweier geometrischer Repräsentationen (je eine vom Crowdworker und aus Referenzdaten) in einen numerischen Wert überführt. Wir werden dieses Maß auf der Grundlage statistischer Auswertungen mit Hilfe eines Ansatzes aus der Informationstheorie ableiten.In einem nächsten Schritt werden mehrfach erfasste Geometrien in eine gemeinsame Geometrie integriert. Wir werden das Qualitätsmaß einerseits zur Bewertung der Qualität der integrierten Geometrien und andererseits zur Optimierung des Integrationsprozesses verwenden. Dies kann auch intrinsisch ohne Vergleich mit Referenzdaten erfolgen.Anschließend untersuchen wir, ob durch den Einsatz eines CNNs eine automatisierte Qualitätsbewertung auch ohne Mehrfacherfassung von Daten möglich ist. Die Eingabe dieses CNNs wird ein Fernerkundungsbild und eine individuelle Geometrie sein, die von einem Crowdworker erfasst wurde. Als Ausgabe soll das CNN ein Qualitätsmaß vorhersagen, das beschreibt, wie gut das Objekt erfasst wurde. Durch den Einsatz eines solchen CNN können wir die mehrfache Erfassung desselben Objekts vermeiden. Dadurch wird die Datenerfassung günstiger.Um die Generalisierbarkeit des Ansatzes zu prüfen, wenden wir ihn auf unterschiedliche Datensätze an. Dies erfordert eine Anpassung unseres Modells an unterschiedliche Domänen. Hierzu verwenden wir einen Active Learning Ansatz, welcher iterativ im Wechselspiel von Crowdworkern und einem CNN die Domänenadaption durchführt. Schließlich gehen wir auf mögliche Folgeforschungsarbeiten ein.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung