Meine erste Kollektion im DARIAH-DE Repository

0 Veröffentlicht von Beata Mache am

Da die geistes- und kulturwissenschaftliche Community endlich ein eigenes fachwissenschaftliches Repositorium hat (1), heißt es nun, Forschungsdaten aus abgeschlossenen und laufenden Projekten zu sichten und zu veröffentlichen. Den Anforderungen der Deutschen Forschungsgemeinschaft nachzukommen (2) und gleichzeitig die eigene Forschung bekannter zu machen — das sollte sich doch lohnen.

Gesagt – getan! Aber welche Daten kann und will man zuerst publizieren? Welche darf man? Bei der zweiten Frage helfen die Dokumentation und die FAQ (3 ), bei der ersten werde ich dann doch unsicher. Bei den älteren Projekten speicherte ich zwar meine Daten (leider nur meistens) unter noch heute interpretierbaren Namen, machte Backups, finde sogar die Speichermedien, aber kann ich diese Dateien jetzt selbst noch nutzen? Und noch wichtiger: Welche Daten sind für die Nachnutzung interessant? Und wie lassen sie sich beschreiben?

Ich entschloss mich, zunächst die Forschungsdaten zur Edition der „Unparteiischen Universal-Kirchenzeitung für die Geistlichkeit und die gebildete Weltklasse des protestantischen, katholischen und israelitischen Deutschlands“ zu veröffentlichen. Die PDF/A der Volltexte sind bei der DNB gesichert und mit URN versehen (4), die anderen (Faksimile, XML, BEACON, Register) sind zwar schon online zugänglich (5), die Seite musste auch noch nicht migriert werden und läuft immer noch stabil, aber für Nachhaltigkeit braucht man wohl doch andere Mechanismen. Also speicherte ich diesen Bestand als meine erste Kollektion im DARIAH-DE Repository. Das Anlegen einer Kollektion und von Unterkollektionen ist intuitiv, die Daten waren im Nu hochgeladen, und die Metadaten für die einzelnen Dateien konnte ich mühelos von denen der Kollektion übernehmen.

Schwieriger war dann doch zu entscheiden, welche der optionalen Metadatenfelder ich ausfüllen will. Eigentlich ist mir klar, dass die möglichst detaillierte Beschreibung das Finden und die Nachnutzung der Daten erleichtert. Trotzdem war ich bei einigen Feldern ratlos und ließ sie leer. Wie soll ich „Abdeckung“ für eine Zeitschrift bestimmen, die „alles Wissenswerthe“ aus aller Welt zu berichten beanspruchte?

So legte ich also Unterkollektionen mit XML-Dateien, Volltexten und Faksimiles als PDF, mehreren Verzeichnissen und Registern an. Und selbstverständlich tat ich ein BEACON-File dazu (6), das meine Annotationen anhand der Gemeinsamen Normdatei versammelt, und auch noch als CSV die Tabelle, in der ich Ergebnisse der monatelangen Recherchen zu einzelnen beteiligten Personen festhielt. KML-Files für die Visualisierung im DARIAH-DE Geobrowser durften nicht fehlen. Am Ende kamen 336 Dateien zusammen, in fünf Unterkollektionen. Man muss sich etwas Zeit dafür nehmen, aber es lohnt sich. Nach zwei Stunden inklusive Neubenennung einiger Dateien und Korrekturlesen der Metadaten (Buch oder Daten – publiziert ist publiziert, da kann man nicht mal eben noch nachträglich korrigieren!) waren meine  in Jahren entstandenen  Forschungsdaten veröffentlicht, mit DOI und Handel referenziert, in der Collection Registry nachgewiesen und von der Generischen Suche indiziert. Ein Blick in das Repository zeigt die im Prozess des Publizierens zugewiesenen weiteren deskriptiven, administrativen und technischen Metadaten, die natürlich sehr wichtig sind. Das Wissen, dass meine Forschungsdaten jetzt dauerhaft nachgenutzt und dabei korrekt zitiert werden können, das ist durchaus aufregend!

In laufenden Projekten — so mein fester Plan — werde ich Daten sukzessiv im OwnStorage des Repositorys speichern — dann ist das spätere Publizieren nur eine Frage von vier weiteren Klicks: Publikationsprozess starten, zusichern, dass man berechtigt ist, die Daten zu veröffentlichen, den Nutzungsbedingungen zustimmen, und viertens den Vorgang bestätigen. Fertig!

(1) Presseinformation der Universität Göttingen: DARIAH-DE Repository gestartet https://www.uni-goettingen.de/de/3240.html?tid=604 auch im DHd-Blog https://dhd-blog.org/?p=8796
(2) Deutsche Forschungsgemeinschaft (DFG). Umgang mit Forschungsdaten: DFG-Leitlinien zum Umgang mit Forschungsdaten. Deutsche Forschungsgemeinschaft. Verfügbar unter http://www.dfg.de/foerderung/antragstellung_begutachtung_entscheidung/antragstellende/antragstellung/nachnutzung_forschungsdaten/
(3) „User Guides und How-to articels“ zu DARIAH-DE Diensten sind im öffentlichen DARIAH-DE Wiki zu finden.
(4) Eintrag im Katalog der DNB
(5) Die gesamte Edition und ihrer Dokumentation: http://www.deutsch-juedische-publizistik.de/universal-kirchenzeitung.shtml
(6) Vgl. dazu: Harald Lordick: BEACON — »Leuchtfeuer« für Online-Publikationen

Kommentar schreiben