Detailseite
Maschinelle Übersetzung und computerbasierte Analyse von Keilschriftsprachen
Antragsteller
Professor Dr. Christian Chiarcos
Fachliche Zuordnung
Ägyptische und Vorderasiatische Altertumswissenschaften
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Allgemeine und Vergleichende Sprachwissenschaft, Experimentelle Linguistik, Typologie, Außereuropäische Sprachen
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung
Förderung von 2017 bis 2021
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 329145082
Geschichte und Kultur des Alten Mesopotamiens - Heimat der ersten Imperien und Geburtsort der Schrift - sind vor allem durch Literatur und Königsinschriften bekannt. Administrative Texte jedoch, die mehr als 90% aller Keilschrifttexte ausmachen, erfahren weniger Aufmerksamkeit: Selbst wenn digitalisiert, verbleiben sie zumeist unübersetzt und so kaum zugänglich, obgleich diese Texte einzigartige soziohistorische Dokumente der Prozesse und Mechanismen frühstaatlicher Ökonomien sind. Durch ihre Zahl ist ihre Übersetzung jedoch kaum möglich: Allein aus dem 21.Jh. v.Chr. besitzen wir mehr als 67.000 digitale, unübersetzte Transkriptionen - wie routinemäßig durch Spezialisten für ausgewählte Perioden und Phänomene erstellt -, die ohne Übersetzung jedoch selbst Experten aus anderen Gebieten der Altorientalistik unverständlich sind. MTAAC verbindet Verfahren des maschinellen Lernens, der statistischen und neuronalen Übersetzung zur Erschließung dieses Material für Altorientalisten, Geistes- und Sozialwissenschaftlern.Kernergebnis ist eine Methodik, deren Implementierung und eine große Zahl übersetzter und analysierter Texte, die unter offenen Lizenzen publiziert werden. Auch über Keilschriftstudien hinaus setzen wir ein Beispiel für die Erschließung derartiger Datensätze in den historischen Philologien. Wegen ihrer hohen Anzahl unterstützen wir die automatisierte Erschließung der betrachteten Texte. In der Sprachtechnologie haben sich hierfür statistische und neuronale Verfahren durchgesetzt, sind jedoch zur Analyse selbst größerer historischer Sprachen bislang kaum herangezogen worden. MTAAC leistet erstmals diesen Brückenschlag für Keilschriftphilologien, und gibt zudem ein Beispiel für Anwendungen maschinellen Lernens und maschineller Übersetzung in den Geisteswissenschaften. Zur Verbesserung der Nach-Nutzbarkeit entwickeln wir Linked-Open-Data-basierte Spezifikationen für die und mit der wissenschaftlichen Gemeinde, und formulieren darauf aufbauende Empfehlungen zur Zusammenarbeit zwischen Protagonisten der Digital Humanities wie Museen und philologischen Portalen.PI Heather Baker, Universität Toronto, Kanada, koordiniert sprachspezifische Fragestellungen; Co-PI Robert Englund, UCLA, Direktor der Cuneiform Digital Library Initiative, verantwortet Datenhaltung und -austausch; Co-PI Christian Chiarcos, Goethe-Universität Frankfurt, Sprachtechnologie und Datenintegration. Methodenentwicklung leisten wir gemeinsam. MTAAC entwickelt einen ganzheitlichen Zugang zu einem hoch repräsentativen Korpus früher Schriftdenkmale und innovative Methoden für dessen kontext-sensitive semantische Analyse. Das Projekt ermöglicht die erstmalige Zusammenarbeit zwischen Forschern weit auseinander liegender Disziplinen. Im Ergebnis ermöglichen wir einen neuen Zugang zu seit langem dahingeschwundenen Zivilisationen, wir fördern das Verständnis moderner Kulturen und ihrer historischen Wurzeln.
DFG-Verfahren
Sachbeihilfen
Internationaler Bezug
Kanada, USA
Mitverantwortliche
Professorin Heather D. Baker; Dr. Robert K. Englund