Project Details
Statistische Modellierung für die Objekterkennung in Bildern
Applicant
Professor Dr.-Ing. Hermann Ney
Subject Area
Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term
from 2003 to 2009
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5412085
Die automatische Erkennung von Objekten in Bildern wird unter anderem für die Schrifterkennung, die Steuerung autonomer Roboter oder die inhaltsbasierte Kategorisierung von Bilddaten aus großen Bilddatenbanken benötigt. In eigenen Vorarbeiten konnte gezeigt werden, dass statistische Verfahren zur Schrifterkennung auf Anhieb international konkurrenzfähige Ergebnisse erreichen, die andere Verfahren erst nach langer Optimierung erzielen. Das Ziel dieses Vorhabens ist die eingehende Untersuchung weiterführender statistischer Modelle. Dabei soll das Projekt von Erfahrungen auf dem Gebiet der statistischen Modellierung im Bereich der automatischen Sprachverarbeitung profitieren. Die Forschungsarbeiten gliedern sich in drei Modellierungsebenen: 1. Modellierung der Objekt-Wahrscheinlichkeitsverteilung: Hier soll die Übertragung des Maximum-Entropy-Ansatzes auf die Objekterkennung evaluiert werden. Dieser viel versprechende Ansatz wurde bisher nicht in der Objekterkennung eingesetzt. 2. Modellierung der Variabilität von Bildobjekten: Diese ist für die Erkennung wichtig, da Objekte unabhängig von der stets auftretenden Variation erkannt werden sollen. Hier soll die Erweiterung von pixelbasierten Modellen im Vordergrund stehen. Diese zum Beispiel als Hidden-Markov-Modell realisierten Beschreibungen sind in der echten zweidimensionalen Variante bisher kaum untersucht worden. 3. Modellierung von ganzen Bildszenen: Die automatische Erkennung komplexen Szenen ist bisher nur in sehr eingeschränkten Domänen möglich. Eine genaue Untersuchung des sog. holistischen Ansatzes der Bilderkennung' (d.h. ohne explizite Segmentierung), wie sie in der Spracherkennung erfolgreich ist, ist hier das Ziel der Forschungsarbeiten. Die Komplexität der zu untersuchenden Algorithmen stellt angesichts der wachsenden Rechnerleistung kein wesentliches Hindernis mehr dar, so dass auch aufwändigere Methoden für die Praxis relevant werden. Gesamtziel des Vorhabens ist ein besseres Verständnis der Modellierungsebenen für die Objekterkennung um so den Stand der Technik in der statistischen Bilderkennung weiter voranzutreiben.
DFG Programme
Research Grants