Detailseite
Projekt Druckansicht

TFB 32:  Automatische Exzerption: Corpusbasierte Materialbeschaffung für die Lexikographie

Fachliche Zuordnung Geisteswissenschaften
Förderung Förderung von 2001 bis 2003
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5485575
 
Wörterbücher werden relativ oft überarbeitet, damit sie auf dem neuesten Stand sind. Dazu lesen Wörterbuchredakteure Zeitungen, Bücher usw. und notieren alles für ihr Wörterbuch Relevante. Diese Aufgabe soll von computerlinguistischer Software unterstützt werden:-- das Durchkämmen großer Mengen Text (z.B. über 100 Millionen Wörteraus Zeitungen) zur Suche nach neuen Wörtern und Wendungen; -- das Klassifizieren der gefundenen Wörter und Wendungen nachlinguistisch-lexikographischen Kriterien; -- der Abgleich des Gefundenen gegen das bestehende Wörterbuch und die Anzeige in einem interaktiven System. Basis sind Verfahren zur lexikalischen Akquisition aus dem früheren Sonderforschungsbereich 340 ("Theoretische Grundlagen für die Computerlinguistik"). Im Jahr 2002 wurden insbesondere Verfahren für die Identifikation und Klassifizierung von Mehrwortausdrücken entwickelt und mit den Verlagen Duden BIFAB AG (Mannheim) und Langenscheidt KG (München) zusammen evaluiert. Daneben wurden die Systemarchitektur und die Interfaces für die Lexikographen spezifiziert. Ein erster Prototyp für einen Teil der notwendigen Funktionen liegt vor.
DFG-Verfahren Transferbereiche

Abgeschlossene Projekte

Antragstellende Institution Universität Stuttgart
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung