Detailseite
Projekt Druckansicht

Feature-based Visualization and Analysis of Natural Language Documents

Antragstellerinnen / Antragsteller Professorin Dr. Iryna Gurevych; Professor Dr. Daniel Keim
Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung von 2012 bis 2016
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 220835651
 
Die Menge digitaler textueller Daten, wie sie beispielsweise von Internetnutzern erzeugt werden, ist in den letzten Jahren rapide gewachsen und hat zu einer gewaltigen Informationsüberflutung geführt. Die merkmalbasierte Visualisierung und Analyse natürlichsprachlicher Dokumente ist daher ein dringliches Mittel, um diesem Problem beizukommen. Suchmaschinen helfen Benutzern relevante Dokumente zu finden, aber sie bieten keine weitergehende Hilfe zur Analyse und zum Verständnis der Textdimensionen, die für den Bedarf des Anwenders von Bedeutung sind. Die größte Schwierigkeit dabei ist die fehlende Verbindung zwischen Textmerkmalen, die automatisch berechnet werden können, und der Intention des Benutzers. Diese Verbindung muss hergestellt werden, um die Interaktion des Benutzers mit dem Dokument zu erleichtern und ihm zu erlauben, Fragen zu beantworten wie, warum zwei Dokumente ähnlich sind, wie diese in Bezug zu einem automatisch berechneten verwandten Cluster gesetzt werden können oder welche Aspekte wesentlich für die Beurteilung der Textqualität oder einer Altersempfehlung sind. Die geplanten Forschungsarbeiten zielen darauf ab, diese Lücke durch neue visuelle Untersuchungstechniken zu schließen. Wir beabsichtigen eine verschiedene Aspekte abdeckende Textanalyse. Diese geht von maschinell berechneten Merkmalen und einer interaktiven, visuell unterstützten Attributaufbereitung aus, die die Untersuchung und Auswertung benutzerdefinierter Texteigenschaften1 in großen Dokumentkollektionen ermöglicht. Die genannten Merkmale können dann für eine erweiterte Analyse von Texten verwendet werden, was zu höherer Effizienz und gesteigerter Genauigkeit führt. Zu diesem Zweck erarbeiten wir neue textuelle Merkmale zur Modellierung inhaltlicher Texteigenschaften. Eine enge Verbindung von automatischer Textanalyse und mehrdimensionaler Text- und Merkmalsvisualisierung ist entscheidend für den beabsichtigten interaktiven Prozess. Die Arbeit ist eingebettet in einem durchgängigen Framework, das die Definition von Text-basierten Merkmalen je nach Bedürfnis des Benutzers unterstützt. Wir evaluieren den vorgestellten Ansatz zur visuellen Textanalyse im Kontext von Qualitätsbewertung und Altersempfehlung.
DFG-Verfahren Sachbeihilfen
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung