Project Details
Referenzkorpus Mittelhochdeutsch (1050-1350)
Applicants
Professorin Dr. Stefanie Dipper; Professor Dr. Klaus-Peter Wegera; Professorin Dr. Claudia Wich-Reif
Subject Area
Applied Linguistics, Computational Linguistics
Term
from 2009 to 2017
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 89085660
Im Rahmen des Projektes soll ein Referenzkorpus für die mittelhochdeutsche Sprachstufe im Rahmen des Korpus historischer Texte des Deutschen (Deutsch Diachron Digital = DDD) bereitgestellt werden, in dem die hochdeutschen Sprachdenkmäler von ca. 1050 bis 1200 weitestgehend vollständig und von ca. 1200 bis 1350 in strukturierter Auswahl zusammengefasst und für eine breite Nutzergemeinde verfügbar gemacht werden. Ziel ist es, eine hinlänglich umfangreiche, verlässliche und handschriftengetreue Datenbasis des Mittelhochdeutschen (1050-1350) zu schaffen, die historiolinguistische und mediävistische Recherchen in einem Maße erlaubt, das weit über das bisher Mögliche hinausgeht. Dieses Ziel soll auf drei Wegen erreicht werden: 1. Vollständige Digitalisierung und grammatische Erschließung der überlieferten Textzeugen der älteren mittelhochdeutschen Zeit bis zum Ende des 12. Jahrhunderts; 2. Anpassung aller bereits vorliegenden linguistisch tief annotierten mhd. Texte an einen erweiterten und modifizierten, mit dem Projekt „Referenzkorpus Altdeutsch“ gemeinsamen STTS-basierten Annotationsstandard; zusammen mit den neu zu annotierenden frühmittelhochdeutschen Texten Konvertierung in das XML-Standoff-Format PAULA und Verfügbarmachen über die linguistische Datenbank ANNIS; 3. Komplette Digitalisierung und Annotation bislang nur ausschnitthaft digitalisierter Texte (und damit Verbesserung der Grundlage zur Untersuchung syntaktischer Strukturen – z.B. eingebettete Sätze – im Mittelhochdeutschen). Insgesamt wird das Referenzkorpus nach der ersten Projektphase etwa 210 mhd. Texte von annähernd 2 Mio. Wortformen enthalten.
DFG Programme
Research Grants