Detailseite
Generische Dokumentstrukturen in linear organisierten Texten: Textparsing mit Domänenontologien und Textstruktur-Ontologien
Antragsteller
Professor Dr. Henning Lobin
Fachliche Zuordnung
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Förderung
Förderung von 2001 bis 2009
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 5468400
Dokument-Grammatiken, die bislang üblichste Ausprägung generischer Dokumentstrukturen, können auf sehr vielfältige Weise semantisch angereichert sein (z.B. durch Style Sheets, Angaben zu Up- und Down-Transformation, beschreibende Dokumentation des Gebrauchs, Element-Namengebung usw.), es gibt für diese semantischen Informationen aber kein integratives Repräsentationsformat. Texttechnologische und computerlinguistische Techniken können für die Dokumentation, Integration und weitergehende Verarbeitung (z.B. automatische Style-Sheet- oder Tranformationsgenerierung) eingesetzt werden. In diesem Projekt sollen verschiedenen Spezifikationstechniken der Bedeutung von Dokumentstrukturen untersucht und ein XML-basiertes Repräsentationsformat zu integrierten strukturell-semantischen Restriktion von Strukturmustern und -elementen spezifiziert werden.
DFG-Verfahren
Forschungsgruppen
Teilprojekt zu
FOR 437:
Texttechnologische Informationsmodellierung