The Hellespont Project: Integrating Arachne and Perseus
Final Report Abstract
Der Projektteil des DAI besteht aus zwei Hauptelementen. 1.) Für den im GapVis-Interface dargestellten Teil wurde als Fallstudie der Text der Pentekontaetie des antiken griechischen Historikers Thukydides gewählt (Thuk. Buch 1, Abschnitt 89-118). In einem sehr dicht geschriebenen Text werden hier laufend die komplexen Verbindungen zwischen historischen Persönlichkeiten, antiken Topographien (Schauplätzen, Städten und Bauwerken) und historischen Vorgängen deutlich. Mit den im Text erwähnten historischen Namen von Orten, Personen und Organisationen wurden zunächst archäologische und historische Hintergrundinformation auf Basis des TEI-Standards durch manuelle Verlinkung auf die Arachne-Datenbank verknüpft. Zudem wurde derselbe Textabschnitt auf zwei Ebenen linguistisch in einer Baumbank analysiert. Außerdem wurden Verweise auf online verfügbare, automatisch extrahierte Sekundärliteratur zur Schriftquelle angefügt. Zu ihrer Erfassung und Analyse erfolgte in einem kooperierenden Projekt speziell die Entwicklung einer eigenen Software. Entscheidend war die Modellierung der historischen Ereignisse, die der antike Autor schildert und die nach zwei komplementären Ansätzen aus dem Text zusammengestellt wurden, auf der Grundlage des CIDOC Conceptual Reference Model. Durch die digitale Analyse und Strukturierung des Textes sowie die Verbindung aller verfügbaren Arten von Quellen zum Themenbereich wird nun der Zugang zu den historischen Zusammenhängen des Zeitraums auch unabhängig von eingespielten Verständnismustern in der modernen Forschung ermöglicht. Alle hier beschriebenen Ergebnisse und Daten sind im GapVis-Portal, dessen Programmierungscode für die Inhalte des Projekts um zahlreiche Funktionen erweitert wurde, online nutzbar: http://gapvis.hellespont.dainst.org/#index 2.) Im eigens implementierten Linked-Data-Interface konnten auf der Grundlage des CIDOC CRM die archäologische Objektdatenbank Arachne und der entsprechende archäologische Teil der Perseus- Datenbank durch die Ausgabe als RDF automatisch integriert werden. Zusätzlich sind dort noch die bereits oben genannten Daten zu den historischen Ereignissen im thukydideischen Text und die zuvor extrahierte Sekundärliteratur gemeinsam mit den anderen Inhalten enthalten und über eine gemeinsame Suchmaske für alle Daten durchsuchbar. Dies stellt eine innovative, mehrere wissenschaftliche Disziplinen verbindende Nutzung von Metadatenstandards dar, die sogar über das ursprünglich anvisierte Projektziel hinausreicht: http://linkeddata.hellespont.dainst.org/ Eine methodische Neuerung ist die besondere Bedeutung der Ereignisse, die auf der Grundlage eines Textmappings sowohl als inhaltliche als auch als technische Schnittstelle vielfältiger wissenschaftlicher Informationen dienen. Durch diesen bisher singulären Ansatz trägt das Hellespont- Projekt entscheidend zur Realisierung des Semantic Web bei. Im Ergebnis konnte eine funktionierende, aussagekräftige und ohne Lizenz nutzbare Web-Anwendung mit allen Daten des Projekts sowie einer umfangreichen Dokumentation erstellt werden (s. unter http://hellespont.dainst.org/startpage/). Die Seite kann durch das Deutsche Archäologische Institut auf Dauer vorgehalten werden. Abweichend von der ursprünglichen Projektplanung war es aus Zeitgründen nicht möglich, einen zweiten Textabschnitt bei Thukydides (Thuk. 2, 35-46) in derselben Weise manuell zu bearbeiten und im GapVis-Interface mit ähnlich reichen Informationen wie den Abschnitt der Pentekontaetie zur Verfügung zu stellen. Stattdessen erfolgte eine (halb-) automatisierte linguistische Auszeichnung der historischen Ereignisse der Pentekontaetie, deren Ergebnisse wir hier als Grundlage für die weitere Entwicklung solcher Werkzeuge präsentieren. Dieser Schritt erschien mit Blick auf die digitale Vernetzung von Forschungsdaten vielversprechender als die zunächst geplante manuelle Annotierung des zweiten Textabschnitts. Auch die Erweiterung des Vorhabens um die Einbindung eines Projekts zur Erfassung von Sekundärliteratur sowie die Erarbeitung linguistischer Daten durch wortgenaue Annotierung in einer Baumbank, die als Datenbeispiel für künftige automatisierte Analysen dienen kann, ist sowohl hinsichtlich ihrer Genauigkeit als auch der hier vorgestellten Kombination von wissenschaftlichen Informationen im Bereich der sogenannten Digital Humanities bisher einmalig. Sie legt den Grundstein für die Strukturierung und Vernetzung größerer digitaler wissenschaftlicher Datenmengen auf der Basis von (halb-) automatisierten Methoden.
Publications
- "Cidoc CRM and text data ‒ Thucydides in the Semantic Web". HESTIA colloquium "New worlds out of old texts: interrogating new techniques for the spatial analysis of ancient narratives", Oxford Juli 2010
A. Thomas
- "CIDOC CRM und Textdaten. Thukydides im Semantischen Web." Kölner und Bonner Archaeologica 1 (2011), 194-198
Thomas, A.
- "The World of Thucydides: From Texts to Artefacts and Back". 39th Annual Conference on Computer Applications and Quantitative Methods in Archaeology (CAA2011), Peking April 2011
M. Romanello / A. Thomas
- 2011. "The World of Thucydides: From Texts to Artefacts and Back." In: Revive the Past. Proceedings of the 39th Annual Conference on Computer Applications and Quantitative Methods in Archaeology (CAA2011), 276-284
Romanello, M., and A. Thomas
- 2012. "Treebanking in the World of Thucydides" CHS Research Bulletin
Mambrini, F.
- "Mining Citations, Linking Texts" ISAW Papers 7.24 (2014)
Romanello, M.