Pressemitteilungen von Parteien und Gewerkschaften
Zusammenfassung der Projektergebnisse
Die bereits seit 2008 betriebene Sammlung von Pressemitteilungen von ca. 200 Parteien und Gewerkschaften wurde in der Projektzeit auf 540 (Projektziel war: 500) laufend erfasste Organisationen (bzw. 630 verschiedene Feed-URLs) ausgeweitet. Hinzu kommt ein abgeschlossener Datenbestand unterschiedlichster Laufzeit von etwa 100 weiteren Organisationen, deren Erfassung bereits vor Projektbeginn oder im Projektverlauf abgerissen war und aus diversen Gründen nicht fortgeführt werden konnte. Für die Erschließung wurde ein Metadatenmodell entwickelt und umgesetzt (Körperschaftsnamen, Geo-Schlagwort, GND-Nummer u.a.). Die Auswahl der zu berücksichtigenden Organisationen erfolgt weltweit und richtet sich nach deren Bedeutung gemäß definierter Kriterien; sie ist noch nicht komplett für alle Länder der Welt erfolgt. Hauptentscheidend für die Erfassung einer relevanten Organisation ist jedoch die Frage, ob ihre aktuellen Meldungen in Form eines RSS-Feeds vorliegen. Diese technische Einschränkung führt durchaus zu inhaltlichen Schieflagen für manche Länder. Um die bisherigen Einzel-Arbeitsschritte zu automatisieren und die eingesetzte kommerzielle Software abzulösen, wurde im Projektverlauf eine Software (Harvesting and Ingestion System) von Grund auf neu programmiert und in der zweiten Hälfte der Projektlaufzeit für das fortlaufende RSS- und Web-Crawling eingesetzt. Mittels Indexierungsprozessen, die zusammen mit einem Solr-Server implementiert wurden, werden die kontinuierlich neu gesammelten Pressemeldungen mit den „normierten“ Metadaten verknüpft und für die Recherche aufbereitet. Die vor Inbetriebnahme der neuen RSS- und Web-Crawl-Software gesammelten Meldungen wie auch der Datenbestand aus der 10-jährigen Sammeltätigkeit vor Projektbeginn wurden ebenfalls auf diese Weise aufbereitet und mit dem Metadatenmodell verzahnt. Um die so verknüpften und indizierten Alt- und Neudaten schließlich zugänglich und durchsuchbar zu machen, wurde eine Website als Benutzerinterface realisiert – die Datenbank „Pressemitteilungen von Parteien und Gewerkschaften“. Die Datenbank ist unter der URL https://library.fes.de/pressemitteilungen/ zugänglich. Auf der Bibliothekshomepage wurde das Projekt in die „Digitale Bibliothek der Friedrich-Ebert-Stiftung“ aufgenommen – mit Links zur Datenbank und zu einer Informationsseite (https://www.fes.de/bibliothek/digitale-bibliothek/pressemitteilungen/).