Project Details
Projekt Print View

KELLIA: Koptische/Coptic Electronic Language and Literature International Alliance

Term from 2015 to 2019
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 273503199
 
Final Report Year 2019

Final Report Abstract

KELLIA steht für “Koptische/Coptic Electronic Language and Literature International Alliance”. Dabei handelt es sich um einen Projektverbund zwischen deutschen und amerikanischen Partnerinstitutionen und -projekten mit dem Ziel, die schon vorhandenen digitalen Tools und Services besser miteinander zu verzahnen und so neue Services zu realisieren. Die teilnehmenden Arbeitsgruppen in Deutschland (Göttingen und Berlin) und USA (Coptic Scriptorium) waren Stand 2015 die wichtigsten Protagonisten für Digital Humanities im Bereich der Koptologie. Dabei vertreten sie verschiedene Teilbereiche der Koptologie, nämlich Editionsphilologie (Göttingen), Lexikographie (Berlin) und Linguistik (USA). Die Zusammenarbeit hat eine Reihe von neuen digitalen Produkten und Services hervorgebracht. Die wichtigsten davon sind: 1. Ein White Paper “Digital Coptology”, in dem Standards und erprobte Tools und Verfahren vorgestellt und empfohlen werden. 2. Eine fortschrittliche NLP-Pipeline (natural language processing), durch die koptische Texte in mehreren Schritten (halb-)automatisch morphologisch und syntaktisch analysiert und ausgezeichnet werden, so dass damit verschiedene Ressourcen wie Wörterbücher und Grammatiken verknüpft werden und schließlich auch weiterführende korpuslinguistische Fragestellungen verfolgt werden können. 3. Eine technische Schnittstelle zwischen neu entstehenden koptischen Texteditionen, die im Virtual Manuscript Room digital erstellt werden, und den linguistischen Analysetools der NLP-Pipeline, so dass eine integrierte Nutzung beider Systeme möglich wird. 4. Ein neues Coptic Dictionary Online, das frei zugänglich ist, und es über eine gemeinsam genutzte Wörterliste möglich macht, linguistisch ausgezeichnete Textkorpora zu integrieren und so die Anzahl und die Breite der Belegstellen für das Lexikon kontinuierlich zu erweitern. 5. Ein stark verbessertes Verfahren zur Optical Character Recognition (OCR) von koptischen gedruckten Texten, das durch ein umfangreiches Anlernen der Software eine Zuverlässigkeit von mehr als 97% erreicht.

Publications

 
 

Additional Information

Textvergrößerung und Kontrastanpassung