Bericht zum DARIAH-DE Workshop „Forschungsdaten in den Geisteswissenschaften. Lizenzen und Best Practice“

0 Veröffentlicht von Matteo Romanello am

Während der Open Access Week, in der freier Zugang zu wissenschaftlicher Literatur in verschiedenen Formen und durch mehrere Veranstaltungen gefeiert wurde, fand am 24. und 25. Oktober der Workshop Forschungsdaten in den Geisteswissenschaften. Lizenzen und Best Practice am Deutschen Archäologischen Institut in Berlin (DAI) statt. Am Montag standen Vorträge zu rechtlichen Aspekten und der „Best Practice“-Thematik auf dem Plan. Ergänzt wurden diese durch „Success Stories”, Projekte, die ihre Erfahrungen zu Lizenzen und Best Practice mit dem Plenum teilten. Der Dienstag war den Hands-On Sessions gewidmet, um den TeilnehmerInnen die Möglichkeit zu geben, die in DARIAH-DE entwickelte Architektur für Forschungsdaten kennenzulernen und die Tools auszuprobieren.

Dieser Workshop ist Teil einer Reihe von durch DARIAH-DE organisierte Veranstaltungen, die das Thema der Lizenzierung und Veröffentlichung von Forschungsdaten in den Geisteswissenschaften adressieren und wurde zusammen mit der Herzog August Bibliothek Wolfenbüttel (HAB) veranstaltet. Weitere Veranstaltungen mit jeweils anderen Schwerpunkten sind für 2017 und 2018 geplant.

Der Workshop richtete sich sowohl an GeisteswissenschaftlerInnen, die bereits erste Erfahrungen mit der Lizenzierung und Erfassung von digitalen Daten gemacht haben als auch an solche, die sich noch in der Planungsphase befinden oder bisher gar keinen Kontakt mit diesem Thema hatten. Insgesamt nahm 16 WissenschaftlerInnen an dem Workshop teil. Die Tatsache, dass die verfügbaren Plätze sehr schnell vergeben waren und auch die Warteliste gut gefüllt war, zeigt das große Interesse in Berlin und deutschlandweit für das Thema Lizenzen und Forschungsdaten.

Nach der Begrüßung und einer allgemeinen Vorstellung des Projekts DARIAH-DE wurden in zwei Vorträgen die juristischen Aspekte der Lizenzierung beleuchtet. Der erste Vortrag von Dr. Paul Klimpel (iRights, Berlin), begann interaktiv mit einer Fragerunde an die TeilnehmerInnen, was überhaupt durch das Urheberrecht geschützt wird. Schon dabei wurde klar, dass die Rechte-Frage nicht immer eindeutig und einfach zu beantworten ist. Anschließend thematisierte Klimpel die Herausforderungen der Lizenzierung von Forschungsdaten in den Geisteswissenschaften anhand der von ihm gemeinsam mit John H. Weitzman verfassten juristischen Handreichung “Forschen in der digital Welt”, die in der Publikationsreihe „DARIAH-DE Working Papers” erschienen ist.

Dr. Christoph Bruch (Helmholtz Gemeinschaft, Potsdam) stellte anschließend ein Papier der Research Data Alliance (RDA) vor, das die rechtliche Interoperabilität von Forschungsdaten zum Ziel hat, also die rechtlichen Aspekte eher von der Nutzersicht aus thematisiert.

Nach der Kaffeepause ging es weiter mit einem zweiten Vortragsblock, der auf Best-Practice abzielte. Dario Kampkaspar (HAB Wolfenbüttel) bot in seinem Vortrag Best-Practice-Ansätze zu verschiedenen Aspekten eines Forschungsprojekts, wie etwa der Veröffentlichung und Lizenzierung der Ergebnisse, aber auch zur Planung am Beginn und der Zusammenarbeit während eines Projektes. Kampkaspar betonte mehrmals die Bedeutung einer konsequenten Dokumentation in allen Phasen – für die erfolgreiche Durchführung eines Vorhabens, aber auch für eine mögliche Nachnutzbarkeit der Daten.

Wie Best-Practice dann praktisch umgesetzt aussehen kann, zeigten Thomas Kollatz (Steinheim-Institut Essen) und Christiane Dressler (Mainzer Akademie der Wissenschaften) anhand ihrer Projektvorstellungen. Beide Referenten hielten fest, dass die Nachnutzung von Forschungsdaten dabei helfen kann, die Datenqualität zu verbessern. Beide Institutionen hatten sich als Data-Provider am Kultur-Hackathon „Coding Da Vinci“ beteiligt. Die Nachnutzung der Daten, die nur durch offene Lizenzen ermöglicht werden kann, führte dazu, dass Bugs in verwendetem Code oder Ungenauigkeiten in den Daten entdeckt (und korrigiert) werden konnten.

Am zweiten Tag hatten die TeilnehmerInnen die Gelegenheit, die aus DARIAH-DE entwickelten Tools zum Forschungsdatenmanagement auszuprobieren. Diese Tools, die gemeinsam die DARIAH-DE Forschungsdaten-Föderationsarchitektur bilden, sind: Publikator, DARIAH-DE Repositorium, Collection Registry, Generische Suche, Schema Registry und Crosswalk Registry.

Zunächst stellte Lisa Klaffki (HAB Wolfenbüttel) den Publikator und die Collection Registry vor. Der Publikator, momentan als Betaversion verfügbar, erlaubt es, Forschungsdaten mit Metadaten zu versehen, sie im DARIAH-DE Repositorium nachhaltig und sicher zu publizieren, und die Forschungsdaten zu durchsuchen. Die Collection Registry dient als zentrales online-Verzeichnis, in dem Forschungsdatensammlungen registriert und beschrieben werden können.

Anschließend stellte Tobias Gradl (Universität Bamberg) weitere Komponenten der Forschungsdaten-Föderationsarchitektur vor, nämlich die Schema Registry, die Crosswalk Registry und die Generische Suche. Diese drei Tools füllen die Lücke zwischen den Daten der in der Collection Registry eingetragenen Sammlungen und der Möglichkeit, diese Daten zu durchsuchen. Da verschiedene Sammlungen unterschiedliche Metadatenstandards benutzen, besteht Bedarf, diese heterogenen Schemata miteinander zu mappen. Um das zu ermöglichen, wurde das grafische Tool Crosswalk Registry entwickelt. Damit können WissenschaftlerInnen verschiedene in der Schema-Registry gespeicherte Metadatenstandards miteinander verbinden. Die Zuordnung ermöglicht eine automatisierte Übersetzung von einem Datenschema in ein anderes und ist die technische Grundlage beispielsweise für die erweiterte Funktionalität der Generischen Suche.

Viele TeilnehmerInnen fanden für ihre eigenen Projekte interessant, dieses Mapping Tool in anderen Forschungskontexten benutzen zu können. Doch gleichzeitig stellt die hohe Komplexität dieser Softwarelösungen für die WissenschaftlerInnen eine große Herausforderung dar. Daher wurde von den TeilnehmerInnen vielfältige Unterstützung gewünscht, um diese Herausforderung überwinden zu können, z.B. durch Workshops, projektspezifische Beratung, umfangreiche Dokumentation und die Beschreibung von konkreten Use-Cases und Szenarien für die Benutzung dieser Tools. Der Großteil dieser Maßnahmen ist in der bereits laufenden dritten Förderphase von DARIAH-DE vorgesehen.   

Kommentar schreiben