Wie es Euch gefällt? Perspektiven wissenschaftsgeleiteter Organisationsformen des Datenmanagements für die Geisteswissenschaften (Bericht vom Panel der AG Datenzentren während der DHd 2019, Mainz & Frankfurt am Main)
Autoren: Ulrike Wuttke, Patrick Helling und Jonathan Blumtritt für die DHd-AG Datenzentren sowie Alexander Czmiel, Katrin Moeller, Peter Gietz, Kai Wörner, Cosima Wagner und Barbara Ebert.
Hintergrund des Panels
Am 27. März 2019 hielt die DHd-AG Datenzentren im Rahmen der DHd 2019 Mainz & Frankfurt am Main (multimedial & multimodal, 25.-29.03.2019, Johannes-Gutenberg Universität Mainz, Akademie der Wissenschaften und Literatur, Mainz, Goethe-Universität, Frankfurt am Main) ein Panel unter dem Titel “Wie es Euch gefällt? Perspektiven wissenschaftsgeleiteter Organisationsformen des Datenmanagements für die Geisteswissenschaften” ab (Link zum Book of Abstract auf Zenodo, dort S. 75-78: http://doi.org/10.5281/zenodo.2600812). Organisiert wurde das Panel von Ulrike Wuttke (Stellvertretende Vorsitzende der AG Datenzentren des DHd, Fachhochschule Potsdam, RDMO), Patrick Helling und Jonathan Blumtritt (beide Data Center for the Humanities, Universität zu Köln). Neben Kai Wörner (Vorsitzender der AG Datenzentren des DHd, Zentrum für Nachhaltiges Forschungsdatenmanagement, Universität Hamburg) als zweitem Moderator, nahmen die folgenden Expert*innen als Panelteilnehmer*innen teil: Alexander Czmiel, Berlin-Brandenburgische Akademie der Wissenschaften (BBAW), Katrin Moeller, Historisches Datenzentrum Sachsen-Anhalt (Hist-Data), Peter Gietz, DAASI & DARIAH-DE, Cosima Wagner, Universitätsbibliothek/Campusbibliothek der Freien Universität Berlin, Barbara Ebert, Leiterin der Göttinger Geschäftsstelle des Rats für Informationsinfrastrukturen (RfII).
Im Mittelpunkt des Panels standen die Perspektiven wissenschaftsgeleiteter Organisationsformen des Datenmanagements für die Geisteswissenschaften vor dem Hintergrund der Anforderungen aus der Praxis, insbesondere den Digital Humanities, und den aktuellen Entwicklungen zum Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI). Einen der Hintergründe des Panels bildete neben den verschiedenen aktuellen Entwicklungen auf dem Weg zur NFDI, insbesondere aus den verschiedenen Workshops der Stakeholder im Bereich der Geisteswissenschaften, der Vorschlag der AG Datenzentren für ein geisteswissenschaftliches Gesamtkonsortium (Link zu einer Sammlung der Positionspapiere). Inzwischen hat sich auch das Geisteswissenschaftliche Forum NFDI mit dem Ziel des Austauschs zwischen den geisteswissenschaftlichen Fachverbänden gegründet. Im Vorfeld des Panels hatten die Organisator*innen über das DHdBlog einen Diskussionsaufruf an die Community gestartet und die Leitfragen des Panels einer breiteren Öffentlichkeit zur Diskussion gestellt. Zentral standen die Rolle von disziplinären Grenzen und disziplinspezifischen Fragestellungen im Spannungsfeld zwischen der Adressierung der Bedarfe kleiner Fächer und den Anforderungen interdisziplinärer Forschung. Auch wenn die “Ausbeute” auf den öffentlichen Diskussionsaufruf zum Panel zahlenmäßig etwas mager war (was vielleicht Mareike Königs Feststellung während ihres Beitrags bei der DHd bestätigt, dass relativ wenig Kommentare zu Blogbeiträgen geschrieben werden), war der Versuch aus Sicht der Organisator*innen die Mühe wert und brachte mit Frederik Elwerts Beitrag einige interessante Erkenntnisse, die er sogar persönlich während des Panels näher beleuchten konnte (mehr dazu weiter unten).
Eingeleitet wurde die Paneldiskussion von der Vorstellung des Stands des Projekts “Dienstekatalog der AG Datenzentren” durch Patrick Helling.
Vorstellung des Stands des Projekts “Dienstekatalog der AG Datenzentren”
Mittlerweile verfügt die AG Datenzentren über insgesamt 25 Mitgliedsinstitutionen aus Deutschland, Österreich und der Schweiz, wovon 18 Einrichtungen mit Infrastrukturen ausgestattet sind. Das Angebot aller Datenzentren der AG in ihrer Gesamtheit weist eine hohe fachliche und institutionelle Diversität auf. Die einzelnen AG-Mitglieder verfügen über unterschiedliche Expertisen in speziellen Forschungsdatenmanagementbereichen und sind in institutionellen oder fachspezifischen Kontexten verortet. Dabei sind sie entweder lokal in einer Institution verankert, agieren auf regionaler oder Verbundsebene oder sind national ausgerichtet.
Mit dem Projekt „Dienstekatalog“ möchte die AG ein gemeinsames FDM-Diensteportfolio entwickeln, welches online zugänglich und entsprechend durchsuchbar sein soll. Auf diese Weise soll das Diensteangebot der einzelnen Zentren gebündelt zugänglich gemacht werden. Zu diesem Zweck wurden semistrukturierte Interviews per Skype oder Telefon durchgeführt (bisher befragte Zentren: 16). Der Fragebogen orientiert sich dabei an einer bereits im Vorfeld durchgeführten, internen Umfrage der AG, sowie an bereits existierenden FDM-Diensteportfolios. Nachdem Katrin Moeller vom Historischen Datenzentrum Sachsen-Anhalt (Hist-Data) auf der DHd 2018 in Köln im Panel der AG Datenzentren „Die Summe geisteswissenschaftlicher Methoden? Fachspezifisches Datenmanagement als Voraussetzung zukunftsorientierten Forschens?“ die speziellen Dienste und Expertisen der einzelnen Mitgliedsinstitutionen präsentiert hat, lag der Fokus in diesem Jahr auf der Breite der generischen Dienste innerhalb der AG.
Im Rahmen der Umfrage wurden insgesamt acht Servicebereiche geisteswissenschaftlicher Datenzentren identifiziert:
1. Beratungsangebote → Klärung von allgemeinen FDM-Fragen
2. Technische Infrastrukturen → Bereitstellung/Vermittlung von Servern, Netzwerken und virtuellen Maschinen
3. Konsolidierung von Services → Service-Level-Agreements, Dokumentationsprozesse und Kuratierungsplanung
4. Speicherung und Archivierung → Langzeitarchivierung von Forschungsdaten
5. Repositoriums-Lösungen → generische/fachspezifische Lösungen
6. Datenkuration → bspw. persistente Identifier, Metadaten, Versionierung
7. Softwarekuratierung → Pflege und Betrieb lebender Systeme
8. Softwareentwicklung → Entwicklung von Tools
Der Auswertung der geführten Interview-Protokolle folgend bieten nahezu alle befragten Datenzentren Beratung zu FDM-Fragen in der Breite an. Insbesondere bei rechtlichen Fragestellungen vermitteln jedoch viele Einrichtungen Forscher*innen an entsprechende Anlaufstellen, da in diesem Bereich häufig keine rechtsverbindliche Expertise vorhanden ist.
Technische Infrastrukturen werden von 15 Datenzentren angeboten, allerdings gab über die Hälfte an, Infrastrukturen nicht selbst zu betreiben. In der Regel wird IT-Infrastruktur von zentralen Einrichtungen wie beispielsweise universitären Rechenzentren vermittelt und auch für eigene Zwecke in Anspruch genommen.
Im Bereich der Übernahmeprozesse und Dokumentation befinden sich viele Datenzentren noch in einer Entwicklungsphase. Service-Level-Agreements und Verträge werden lediglich von neun Zentren, Kuratierungsplanung von 10 Zentren angeboten. Allgemeinere Dokumentationsprozesse werden von 12 Einrichtungen gepflegt.
Ein wichtiger Kern geisteswissenschaftlichen Forschungsdatenmanagements, die Speicherung von Forschungsdaten, wird von allen befragten Datenzentren der AG angeboten. 12 Befragte gaben an, eine Langzeitarchivierung von 10 Jahren und/oder darüber hinaus gewährleisten zu können. Aktuell werden von den Mitgliedern der AG Datenzentren 16 Repositorien betrieben, wovon 11 fachspezifisch und 5 generisch ausgerichtet sind. Insgesamt vier der Repositorien sind aktuell zertifiziert, alle anderen streben eine Zertifizierung an.
Alle Datenzentren bieten die langfristige Kuratierung von Forschungsdaten an. Der jeweilige Umfang der Kuratierung unterscheidet sich allerdings zwischen den verschiedenen Zentren: Beispielsweise bieten nur acht Zentren eine Versionierung an und 10 Einrichtungen gaben an, die Anlage bzw. Extraktion von Metadaten zu übernehmen. 12 der Befragten vergeben persistente Identifier.
Die Entwicklung von Services im Bereich der Softwarekuratierung ist in den meisten Zentren noch nicht umfassend entwickelt. Lediglich ein Zentrum gab an, lebende Systeme zu hosten und/oder in den Dauerbetrieb zu übernehmen. Neun weitere Einrichtungen würden dies lediglich für eigene, oder für mit der eigenen Infrastruktur kompatible lebende Systeme anbieten.
Mit der Softwareentwicklung unterstützen einige Datenzentren direkt digitale geisteswissenschaftliche Forschung: 11 der Befragten gaben an, Tools für die Forschung zu entwickeln. Jeweils neun Zentren arbeiten an der Entwicklung von Schnittstellen und Portalen. Eine der befragten Einrichtungen gab an, Repositorien für Forscher*innen aufsetzen und einrichten zu können.
Die AG funktioniert als etablierter, kollaborativer und forschungsnaher Verbund geisteswissenschaftlicher Datenzentren. An den unterschiedlichen Standorten decken die einzelnen Datenzentren der AG in unterschiedlichsten Ausprägungen geisteswissenschaftliche FDM-Bedarfe in der Breite ab. Zusammen mit den jeweiligen Schwerpunktbereichen in Forschung und Services stellt die AG auf Zentrumsebene die Gesamtheit notwendiger Service- und Dienstestrukturen, auch oder gerade insbesondere im Hinblick auf die Entwicklungen einer Nationalen Forschungsdateninfrastruktur (NFDI) zur Verfügung.
Die Zusammenführung der gewonnenen Informationen aus den geführten Interviews ist aktuell weiter im Prozess und soll bis Ende 2019 in einem Online-Format präsentiert werden.
Paneldiskussion
Mit kurzen Referaten von jeweils 4 Minuten und den jeweils anschließenden Gelegenheiten zur direkten Nachfragen und Kommentaren stellten die Panelisten ihre Sicht auf Organisationsformen des Datenmanagements dar. Als Impuls hatten die Einreichenden folgende Leitfragen formuliert:
- Welche Rollen spielen disziplinäre Grenzen und disziplinspezifische Fragestellungen für die Etablierung einer Forschungsdatenkultur und ihre Organisationsform in den Geistes- und Kulturwissenschaften?
- Welche Auswirkungen hat die jeweilige Organisationsform des Datenmanagements auf multimediale, interdisziplinäre Forschungsprojekte? Welche besonderen Herausforderungen und Bedarfe stellen sich hier?
- Wie können wir sicherstellen, dass auch kleinere Fachdisziplinen beteiligt und ihre Bedarfe adressiert werden?
- Wie erreichen wir, dass wir uns nicht zu weit vom Forschungsalltag der Wissenschaftler*innen entfernen?
- Wo sind spezifische Angebote notwendig, wo reichen generische Dienste?
- Was können wir von anderen Disziplinen lernen, in denen sich schon eine gemeinsame Forschungsdatenkultur etabliert hat?
Alexander Czmiel, Leiter Informationstechnologie und Digital Humanities an der BBAW, machte sich mit seinem Beitrag stark dafür, Digital Humanities und Forschungsdatenmanagement nicht getrennt zu denken. In einer wissenschaftsgeleiteten Infrastruktur müsse die (nur digital zu beantwortende) Forschungsfrage vor der Entwicklung von Forschungssoftware stehen, nicht umgekehrt.
Die notwendigen Konzepte, Standards und die entsprechenden Datenzentren existierten bereits weitgehend, allerdings fehle es an verbindlichen Richtlinien, Standards, Werkzeugen und Technologien. Die Aufgabe der DH sei es, Standards und Methoden in die Fächer zu diffundieren, während die Fachwissenschaftler*innen die Bedarfe zur Beantwortung ihrer Forschungsfragen klar formulieren müssten. Alexander Czmiel machte auf die Frage der Qualifikation und der Personalentwicklung im Bereich der dringend benötigten Fachkräfte, wissenschaftliche Softwareentwickler (Research Software Engineers), aufmerksam. Es sei zum einen schwer, qualifiziertes Personal zu finden, auf der anderen Seite bestünden kaum etablierte Karrierewege für Entwickler*innen im Wissenschaftsbetrieb, noch sei eine dauerhafte Finanzierung der Stellen gegeben.
Katrin Moeller vom Historisches Datenzentrum Sachsen-Anhalt (Hist-Data) in Halle betonte die Unterschiede in der Digitalität der Arbeitsweise, die häufig noch zwischen Digital Humanities und Fachwissenschaften – hier vor allem im Bereich der Geisteswissenschaften – bestünden. Während in den Digital Humanities in der Regel die Forschungsfragen auf einer bestehenden Datengrundlage aufgebaut werden, müssten in den Fachwissenschaften die Forschungsdaten zur Beantwortung aktueller Forschungsfragen erst noch generiert werden. Der zusätzliche Aufwand, der durch Anforderungen des Forschungsdatenmanagement in den Fachwissenschaften entstünde, könne aber nicht unendlich ausgedehnt werden.
Eine „Datenkultur“ müsse langsam von unten und gemeinsam mit den Fachdisziplinen und Bibliotheken aufgebaut werden. Im Aufbau einer Datenkultur sei ein disziplinärer Ansatz wichtig. Bislang mangele es vor allem an Infrastrukturen und Ressourcen, insbesondere an qualifizierten Datenkurator*innen.
Peter Gietz, Geschäftsführer der DAASI International GmbH, Partner in der DARIAH-DE Betriebskooperation und Mitglied im DHd-Vorstand, kommentierte den Prozess hin zu einer NFDI mit Rückblick auf vorangegangene durch das BMBF geförderte Initiativen in den Digital Humanities (DARIAH, CLARIN, eHumanities-Zentren, …). Trotz guter Ansätze in den vergangenen Jahren, hätten diese jedoch keine Lösung der Nachhaltigkeitsproblematik herbeiführen können, da diese nur politisch bzw. förderpolitisch erreicht werden könne. Auf diesem Hintergrund mahnte er an, die NFDI nicht in den Formen klassischer “Projektforschungsförderungstrukturen” zu gestalten und zu begreifen. Kritisch betrachtete er auch die sich abzeichnende Ausbildung verschiedener Konsortien in den Geisteswissenschaften begünstigt durch das kompetitive Verfahren. Peter Gietz stellte die Frage, ob diese Struktur geeignet sei, das bisher Erreichte und zukünftige Entwicklungen den Geisteswissenschaften in der Breite zu Gute kommen zu lassen. Ideal wäre, wenn alle Institutionen, die über wichtige geisteswissenschaftliche Forschungsdaten oder entsprechende Dienste verfügen, am NFDI-Prozess – ob mit oder ohne Finanzierung – beteiligt werden könnten. Weiterhin appellierte er an die im Prozess beteiligten Vertreter der Geisteswissenschaften, ihre Probleme nicht isoliert zu betrachten, sondern geschlossen zu agieren und betonte die Rolle, die die DHd und das Forum “geisteswissenschaftliche NFDI” der DHd bei der Vernetzung spielen könne.
Cosima Wagner[vertrat auf dem Panel die Perspektive von Regionalstudienfächern (hier: Ostasienwissenschaften) und anderen Fächern, die auf der Basis von Quellen in nicht-lateinischen Schriften (NLS) forschen, lehren und publizieren sowie durch eine große Bandbreite an Methoden und Gegenständen gekennzeichnet sind. Obwohl diese Fächer einen wichtigen Beitrag zur Internationalisierung der Forschung in Deutschland leisteten, seien ihre Bedürfnisse bislang in den lokalen ebenso wie den überregionalen Infrastrukturen systematisch unterrepräsentiert. Zwar könnten Forschungsdaten in NLS in den meisten Repositorien gesichert, jedoch nicht in den Metadaten in NLS beschrieben werden. Ebenso mangele es an multilingual optimierten FD-Discovery-Systemen, so dass Forschungsdaten in NLS bislang nicht aufgefunden werden könnten. Hier wäre eine Unterstützung durch die DHd AG Datenzentren wünschenswert (Multilingualität als Teil eines DINI-Zertifikats!).
Für die Ausgestaltung der NFDI aus der Sicht dieser Fächer sei die Formulierung von NLS Daten-use cases und ein offenes Auge für internationale Kooperationen (FDM best practices in NLS Ländern) grundlegend.
Barbara Ebert berichtete über den NFDI-Prozess aus der Perspektive der Geschäftsstelle des RfII. Die NFDI sei als übergreifende Struktur ausgelegt, die nicht zentralistisch oder direktiv Formen vorgeben solle, sondern die Gelegenheit biete, Gewachsenes zu ordnen und zu konsolidieren und für eine nationale Nutzung geeignete Modelle auszuwählen. Die Basis hierfür bilden Partnerschaften zwischen wissenschaftlichen Communities und Diensteanbietern. Mit einer langen Planungs- bzw. Einstiegsphase, einem nicht primär kompetitiv angelegten Verfahren und der auf 10 Jahre angelegten Förderperiode wird das Ziel verfolgt, alle Akteure einzubinden und die Bedingungen für auf Dauer angelegte Lösungen jenseits projektförmiger Infrastrukturförderung zu schaffen. Gleichzeitig sei die NFDI jedoch ein “Realexperiment”, der gewählte Ansatz müsse sich zunächst bewähren. Bund und Länder hätten die Finanzierung daher zunächst auf 10 Jahre vereinbart. Die GWK wolle die NFDI vor Ablauf dieser Zeit evaluieren, um über eine Weiterfinanzierung zu entscheiden.
Zusammenfassung und Ausblick
Die Diskussion mit allen Teilnehmer*innen wurde von einer näheren Erläuterung von Frederik Elwert zu seinem Kommentar zum Diskussionsaufruf zum Panel im DHd-Blog eingeläutet (in voller Länge hier nachzulesen). Er skizzierte aus Sicht der Religionswissenschaft einige Bedenken zu einer “Sortierung” der NFDI nach Materialsorten, eine Option, die im Vorfeld verschiedentlich aufgetaucht war. Er betonte die Wichtigkeit vernetzter Organisationskriterien, die gerade für interdisziplinäre Forschung sehr wichtig ist. Außerdem thematisierte er, dass es für kleinere Fächer nicht einfach ist, sich für eines der Konsortien zu entscheiden, dass sie am besten vertritt. Dieser Punkt wurde dann in der weiteren Diskussion unter anderem unter dem Gesichtspunkt aufgenommen, wie es sichergestellt werden kann, dass die kleineren Fächer zu Wort kommen, ob in mehreren geisteswissenschaftlichen NFDI-Konsortien oder einem geisteswissenschaftlichen Gesamtkonsortium.
Insgesamt wurde der NFDI-Prozess in der Diskussion positiv bewertet, weil hierdurch ein Prozess zur lange notwendigen Konsolidierung in Gang gesetzt wurde, um einen Weg zu verlässlichen Infrastrukturen zu finden, da diese für die Wissenschaft unerlässlich sind. Es wurde auch deutlich, dass man irgendwo anfangen muss und die NFDI durchaus als eine Art “Realexperiment” betrachtet werden muss. Zum einen, weil sich erst zeigen muss, welche Lösung mehrheitlich praktikabel erscheint und zum anderen sich diese dann auch in der Praxis behaupten muss. Bei allen Diskussionen um mögliche Konsortien sollte auch nicht vergessen werden, dass es im Endeffekt um EINE NFDI geht, deren Konsortien gut untereinander vernetzt sein sollen. Im Rahmen dieses Prozesses müssen Governance- und Kommunikationsstrukturen entwickelt werden, um eine gute Balance zwischen den Bedarfen großer Fächer bzw. generischen Diensten, die vielen etwas nützen, und “exotischen” Bedarfen, wie die im Panel mehrmals thematisierten nicht-lateinischen Schriften, zu finden.
Ressourcen:
- Abstract: U. Wuttke, J. Blumtritt, P. Helling, ‚Wie es Euch gefällt? Perspektiven wissenschaftsgeleiteter Organisationsformen des Datenmanagements für die Geisteswissenschaften’, Panel, Abstract in: DHd 2019 ‚Digital Humanities: multimedial & multimodal’, Konferenzabstracts, Universitäten zu Mainz und Frankfurt, 25. bis 29. März 2019, S. 75-78, Link: http://doi.org/10.5281/zenodo.2600812,
- Slides: Wuttke, Ulrike, Helling, Patrick, Blumtritt, Jonathan, Czmiel, Alexander, Moeller, Katrin, Gietz, Peter, Wörner, Kai, Wagner, Cosima, Ebert, Barbara. (2019, March). Wie es Euch gefällt? Perspektiven wissenschaftsgeleiteter Organisationsformen des Datenmanagements für die Geisteswissenschaften (Panel AG Datenzentren DHd2019). Zenodo. http://doi.org/10.5281/zenodo.2616807
Informationen zur DHd-AG Datenzentren:
Convenorin: Katrin Moeller (katrin.moeller[@]geschichte.uni-halle.de)
Stellvertreterin: Ulrike Wuttke (ulrike.wuttke[@]gmx.net)
AG-Webseite: http://dig-hum.de/ag-datenzentren
Kommentar schreiben