correspSearch — neue Daten, neue Schnittstellen

5 Veröffentlicht von Stefan Dumont am

Der Webservice correspSearch weist mittlerweile knapp 16.000 edierte Briefe in über 60 digitalen und gedruckten Publikationen nach. Erst kürzlich sind neue Metadaten zu verschiedenen Korrespondenzen hinzugekommen, z.B. aus der Alfred Escher-Briefedition, die erst im letzten Jahr mit einem Relaunch abgeschlossen wurde. Auch das Zentrum für Informationsmodellierung in Graz hat die Metadaten seiner digitalen Briefedition “Alexander Rollett. Seine Welt in Briefen 1844-1903” mit Normdaten aufbereitet und zur Verfügung gestellt. Darüber hinaus hat die Sächsische Akademie der Wissenschaften (SAW) und das Bach-Archiv Leipzig die Briefe der Bach-Familie aus verschiedenen gedruckten Editionen in einem digitalen Briefverzeichnis nachgewiesen. Alle Briefmetadaten sind nun in correspSearch aggregiert und können dort durchsucht sowie abgerufen werden. Dort findet man auch einen Überblick über den gesamten Datenbestand.

Neue Briefmetadaten sind weiterhin sehr erwünscht: Jedes wissenschaftliche Projekt kann seine edierten Briefe mit Hilfe eines Verzeichnisses im „Correspondence Metadata Interchange Format“ (CMIF) in correspSearch nachweisen lassen. Ausführliche Informationen, wie das funktioniert, finden Interessierte auf correspSearch unter dem Menüpunkt “Mitmachen”.

Das CMIF wurde und wird im Rahmen der Special Interest Group „Correspondence“ der Text Encoding Initiative (TEI) entwickelt. Es verzeichnet derzeit die Kopfdaten eines Briefes, d.h. Absender, Empfänger, Schreibort, Datum etc. In Zukunft sollen darüber hinaus auch weitere Metadaten im CMIF verzeichnet werden können, wie z.B. im Brief erwähnte Personen. Die Weiterentwicklung ist im Artikel “Perspectives of the further development of the Correspondence Metadata Interchange Format” skizziert und kann dort auch diskutiert werden.

Der Webservice selbst wird ebenfalls kontinuierlich weiterentwickelt. So verfügt er neben den bereits vorhandenen Schnittstellen (TEI-XML, TEI-JSON und BEACON) seit kurzem auch über eine (experimentelle) API, die die Daten als Tabelle im CSV-Format ausliefert. Dadurch können die Daten ohne Aufwand in Programme wie Microsoft Excel oder LibreOffice übernommen werden. Die Schnittstelle nutzt u.a. das XSLT-Skript „cmi2csv“ nach, das von Dr. Klaus Rettinghaus (SAW Leipzig) entwickelt wurde. Rettinghaus hat darüber hinaus auch ein Python-Skript zur Verfügung gestellt, dass aus CSV-Tabellen eine CMIF-Datei generiert.

Wer sich für correspSearch interessiert, findet auf der Website weitere Informationen. Über neue Daten und Funktionen informiert ein Twitter-Account sowie ein RSS-Feed. Außerdem wird der Webservice demnächst auf dem Workshop „Wissenschaftsgeschichte und Digital Humanities in Forschung und Lehre“ des Fachverbands Wissenschaftsgeschichte sowie auf der DH 2016 vorgestellt.

Der Webservice correspSearch wurde und wird von TELOTA, der DH-Initiative der Berlin-Brandenburgischen Akademie der Wissenschaften, entwickelt und betrieben. 2015 gewann das Projekt den Berliner Digital Humanities-Preis (1. Platz).

Ein Kommentar Kommentar schreiben
  • Patrick Sahle

    Antworten

    Hier wächst mal wieder etwas wirklich gutes scheinbar einfach so bottom up heran. Tatsächlich natürlich nicht „einfach so“, sondern durch großartige Arbeit von Stefan Dumont und der BBAW. Es sollten wirklich alle digitalen Briefeditionen hier ihre Daten bereitstellen. Damit bald die 100.000-Briefe-Marke geknackt wird und man dann sehen kann, was auch für analytisches Potential in so einer Schnittstelle steckt. Ich bin schon sehr gespannt.

Kommentar schreiben