Workshopbericht: Daten- und Metadatenformate und Import in das DARIAH-DE Repository

0 Veröffentlicht von Stefan Buddenbohm am

DARIAH-DE Logo mit deutscher Unterschrift CMYK 1.1Die DARIAH-DE Forschungsdaten-Föderationsarchitektur stellt verschiedene Dienste und Anwendungen mit dem Ziel der komfortablen Aggregation und Nachnutzung von geisteswissenschaftlichen Forschungsdaten zur Verfügung. Eine zentrale Rolle spielt dabei das DARIAH-DE Repository. Wie aber gelangen Forschungsdaten in das Repository? Wie werden sie erschlossen? Wie verfügbar gemacht, vernetzt oder erweitert?

Diesen und anderen Fragen widmete sich ein DARIAH-DE Workshop am 15. und 16.08.2017 in Göttingen unter der Überschrift „Daten- und Metadatenformate und Import in das DARIAH-DE Repository“. 15 Expertinnen und Experten aus Forschungseinrichtungen, Informationsinfrastruktureinrichtungen, Bibliotheken und Archiven diskutierten intensiv die möglichen individuellen und fachspezifischen Anwendungsfälle und ihre Nutzungsvorstellungen an das DARIAH-DE Repository. Das Treffen wurde von DARIAH-DE mit der Zielsetzung initiiert, Rückmeldungen aus der Community zu erhalten, die in die Weiterentwicklung der DARIAH-DE-Dienste, insbesondere des Repositorys, einfließen sollen.

Die DARIAH-DE Forschungsdaten-Föderationsarchitektur

Nach einer Vorstellung der DARIAH-DE Forschungsdatenarchitektur, dem aktuellen Entwicklungsstand von DARIAH-DE Repository und DARIAH-DE Publikator (=Ingestschnittstelle), der Data-Seal-of-Approval-Zertifizierung des Dienstes standen die Use Cases und Nutzungsvorstellungen der Teilnehmenden im Mittelpunkt. Dazu wurden konkrete Forschungsdatenbeispiele der Teilnehmenden mit DCSimple ausgezeichnet und mit Hilfe des Publikators in das DARIAH-DE Repository eingespielt.

Unter anderem folgende Fragestellungen diskutierten die Teilnehmenden: Wie müssen praktikable Metadatenschemata zur Erschließung der Forschungsdaten beschaffen sein, die gleichzeitig einen Kompromiss zwischen vertretbarem Arbeitsaufwand auf der Ablieferungsseite und möglichst reicher Datengranularität auf der Repositoryseite bieten? Welche Metadaten sind als Pflichtfelder im Erschließungsworkflow des Publikator unverzichtbar? Reichen die 15 Felder des Dublin Core Simple-Schemas zur Beschreibung geisteswissenschaftlicher Forschungsdaten aus, insbesondere um die Verwertbarkeit für eine Nachnutzung beurteilen zu können? Wie wird das Verhältnis von Aufwand und Nutzen einer DSA-Zertifizierung bewertet? Unter welchen Gesichtspunkten ist eine DSA-Zertifizierung sinnvoll und welche Wirkung erzielt ein zertifizierter Dienst damit? Welchen Funktionsumfang und welche Nutzungserfahrung sollten DARIAH-DE Collection Registry und Generische Suche anbieten und wie können sie attraktiver für Drittnutzer gestaltet werden, bspw. als MWW-Suche zusätzlich zur DARIAH-DE-Suche? Sollen bspw. über die Objekte selbst hinaus auch die Kollektionsmetadaten indiziert werden? Welchen Funktionsumfang und welches Nutzungserlebnis soll die Ingest-API des DARIAH-DE Repository mitbringen? Welchen Mehrwert bietet die Forschungsdatenarchivierung im DARIAH-DE Repository gegenüber bspw. Zenodo?

In der Runde der Workshopteilehmerinnen und -Teilnehmer wurde gerade der Punkt Metadatenauszeichnung intensiv diskutiert, mit dem Ergebnis, dass unter Umständen die Auszeichnung mit DCSimple den einen schon zu komplex und umständlich erscheint. Anderen wiederum reichen die Möglichkeiten von DCSimple nicht aus und erscheinen für eine eine detaillierte Beschreibung ihrer Daten zu ungenau und zu eingeschränkt. Die Lösung könnte ein Drei-Stufen-Modell sein, dass eine Metadatenauszeichnung in folgenden Stufen ermöglicht:

  1. Wenig Aufwand für eine schnelle Publikation: Die Angabe von einigen wenigen erforderlichen Metadatenfeldern in DCSimple reicht aus.
  2. Nutzung von DataCite-Metadaten: Einbinden des DataCite Metadatenschemas.
  3. Auszeichnung per DCMI Metadata Terms: Möglichkeit der detaillierten Auszeichnung der Sammlung und ihrer Objekte.

Der OAI-PMH-Service des Repositorys müsste dann ebenfalls erweitert werden, so dass hier nicht nur DCSimple, wie als Mindestanforderung von OAI-PMH verlangt, abgerufen werden kann, sondern ebenfalls DataCite und DCTerms. Eine Verknüpfung mit dem DARIAH-DE Data Modeling Framework (DME) wäre dann der nächste Schritt.

Der enge Austausch mit der Community wird fortgesetzt, die Beiträge des Workshops werden in die weitere Entwicklung des DARIAH-DE Repositorys einfließen und teilweise bereits vor dem Release des Dienstes Ende September umgesetzt.

Kommentar schreiben