RfII-Diskussionsimpuls 2018: Forschungsdaten(infrastrukturen) sind der Mittelpunkt von Forschung!
Am 15. Februar 2018 fand der erste von drei Workshops „Wissenschaftsgeleitete Forschungsinfrastrukturen für die Geisteswissenschaften“ statt, der einen Prozess der Konsortienbildung im Rahmen der Ausgestaltung Nationaler Forschungsdateninfrastrukturen in den Geisteswissenschaften bündeln und formieren möchte. Eingeladen waren zahlreiche, vornehmlich sprachwissenschaftlich orientierte, Verbände der Geisteswissenschaften und weiterer fachwissenschaftlicher Domänen. Sozusagen im Nachgang legte kurz darauf der Rat für Informationsinfrastrukturen (RfII) mit seiner Schrift „Zusammenarbeit als Chance“ einen neuen Diskussionsimpuls zur Ausgestaltung einer nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland vor. In meiner eigenen fachwissenschaftlichen Community wirkt diese Schrift daher fast wie eine Ergebniszusammenfassung des Workshops, auch wenn dies vielleicht Zufall ist. Den Aufruf zur Diskussion von Patrick Sahle (Beitrag „Auf dem Weg zu einem Netzwerk mit Kanten aber ohne Knoten?“) aufgreifend, möchte ich ebenfalls aus der Perspektive einer Wissenschaftlerin einige Eindrücke zusammenfassen.
Bedürfnisse des Forschungsdatenmanagements und der Digitalisierung in der Geisteswissenschaft
Die Anforderungen der Fachcommunities an wissenschaftsgeleitete Forschungsinfrastrukturen für die Geisteswissenschaften sind weit, dies zeigte der Berliner Workshop. Sie sind so weit, weil die Geisteswissenschaften nach wie vor einen hohen Nachholbedarf im Rahmen digitaler Dienste und Services besitzen. Besonders problematisch bleibt für die Geisteswissenschaft, dass sie zahlreiche digitale Dienste weder aus direkten eigenen fachwissenschaftlichen Kompetenzen noch als Serviceleistungen ohne zusätzliche Ressourcen (Drittmittel) erlangen kann. Geisteswissenschaftler müssen heute daher fast immer Mehrfachkompetenzen aufbauen, um solche digitalen Erfordernisse zu erfüllen. Dies macht Forschungsdateninfrastrukturen für „alle“ so attraktiv. Wissenschaftsgeleitete Forschungsinfrastrukturen wurden von den Fachgesellschaften (vgl. Folien der Beiträger) daher beschrieben in der:
a) Digitalen Bereitstellung von Ressourcen, die Forschungscommunities im Sinne flexibilisierter Nationallizenzen einen barrierefreien Zugang eröffnen (und nicht von der Zugehörigkeit zu einzelnen Institutionen abhängig sind)
b) Digitalisierung der Forschung im Sinne des Aufbaus digitaler Strukturen für die Erfassung, Aufbereitung, Analyse und Repräsentation wissenschaftlicher Daten und Forschungsergebnisse in einem Spektrum von Heterogenität (flexible, unkomplizierte Anpassung an Forschungsziele) und Homogenität (Verhinderung von Insellösungen)
c) Interoperationalität von Forschung durch die Herausbildung bzw. Kanonisierung fachwissenschaftlicher und technischer Standards (Tools, Verfahren, Methoden, Thesauri), die zugleich Konkurrenz und Diversität ermöglichen und über maschinenlesbare, offene Schnittstellen einen einfachen Austausch gewährleisten
d) Qualitätssicherung von Daten durch intensive Datenkuration und fachspezifisches Forschungsdatenmanagment, breite Dokumentation von Prozessen der Datenaufnahme zur Absicherung der Nachnutzung und vor allem fachspezifischen Erschließung und Verstehbarkeit
e) Förderung der wissenschaftlichen Reputation von digitalen Arbeitstechniken durch digitales Rezensionswesen, vertrauenswürdige Prinzipien der Datenautorenschaft bei Weiterverwendung von Daten, wissenschaftlich gesicherte Anerkennung digitaler Leistungen, Aufbau eines fachspezifischen Gutachterwesens
f) Mit solchen Prozessen integrierte Lehre und Ausbildung im Rahmen von Digital Humanties und Data Scientists, Weiterbildungsmöglichkeiten des heutigen wissenschaftlichen Personals (Multiplikatorenrolle)
g) Digitale Ergebnissicherung unter Einhaltung von Metadaten, Formaten und rechtlichen Standards zur nachnutzbaren Bereitstellung in langzeitgesicherten, vertrauenswürdigen Repositorien.
Längst nicht alle dieser Bedürfnisse werden heute unter dem Stichwort „Forschungsdateninfrastrukturen“ verhandelt. Man darf also festhalten, dass es ebenfalls viele fachwissenschaftliche Bedürfnisse gibt, die vor allem die neuen Kulturen des Forschungsdatenmanagements betreffen.
Das Verhältnis von Bedürfnissen und Ressourcen
Trotz der Breite dieser Bedürfnisse lässt sich das Fazit ziehen, dass grundsätzlich eine hohe Übereinstimmung mit den Zielen des RfII-Papers „Zusammenarbeit als Chance“ festhalten lässt. Ein breites kooperatives Netzwerk an Ressourcen und Services zu schaffen, findet überall intensive Zustimmung in den Geisteswissenschaften wie auch die Idee hierfür eine einheitliche Gouvernance-Struktur mit einem gemeinsamen Konsortium zu schaffen, dass dann auch innerfachwissenschaftlichen Koordinierungsbedürfnissen Rechnung trägt.
Übereinstimmung lässt sich vor allem darin finden, dass international vernetzte Dienste und Datensammlungen künftig gemeinsam zur allgemeinen Verfügung stehen. Man kann momentan nur hoffen, dass darin nicht nur eine Vergemeinschaftung von Daten und Forschungsergebnissen, sondern tatsächlich auch eine Vergemeinschaftung von Ressourcen und Services für spezifische Forschungsvorhaben gesehen werden. Bis heute ist etwa der Zugang zu den Büchern und Zeitschriften strikt an die Institution gebunden. Im letzten Jahrzehnt wurde die Konkurrenz um Ressourcen eher verschärft als eingeebnet (Förderung von Eliteuniversitäten, zunehmende Trennung von Forschung und Lehre, Wettbewerbsvorteile großer Institutionen). Daten unterliegen natürlich urheberrechtlichen Schranken, gerade in den Geisteswissenschaften. Das neue Urheberrechts-Wissensgesellschaftsgesetz ändert daran nur partiell etwas. Wie die Weiternutzung von Daten auch wissenschaftliche Reputation oder gar Vergütung erfahren, ist – besonders für die Geisteswissenschaften – bisher nur angerissen, nicht aber ausdiskutiert oder geklärt (hier verweise ich gerne auf meinen Vorschlag zur Datenautorenschaft mit Folien bei der DHd 2018).
Übereinstimmung besteht auch darin, dass der Erfolg von Nationalen Forschungsdateninfrastrukturen in der wissenschaftsgetriebenen Ausgestaltung dieser Dienste und in einer breiten Akzeptanz durch die Fachcommunities liegt. Es bleibt für mich aus dieser Perspektive allerdings ziemlich unverständlich, warum das Diskussionspapier des RfII zwischen einer wissenschaftlichen Community auf der einen und Infrastruktur-Partnern auf der anderen Seite trennt? Vielmehr kann man in der Forschungspraxis bereits seit längerem einen Formierungsprozess in der Wissenschaft selbst beobachten, der zur Gründung von fachlichen Datenzentren im unmittelbaren Umfeld von Institutionen führt. In dieser Weise wirksam sind etwa die in der AG Datenzentren des Verbands Digital Humanities organisierten Zentren, die bereits zahlreiche Dienste und Services – momentan stark limitiert durch einen etwaigen Projektstatus oder institutionelle Beschränkungen – aufbauen und Kompetenzen einbringen. Genau dort, wo der Bedarf zu typischen Diensten im Bereich Datenmanagement, -analyse und -erschließung sowie generischen Dienste für die Verarbeitung von Daten vorhanden ist, wirken diese Akteure. Genau sie entstehen forschungsgetrieben! Dies ist auch kaum verwunderlich, denn Forschende verbringen bis zu 80 % ihrer Arbeitszeit mit Datenerhebung, -modellierung und -analyse. Forschungsdaten sind Forschung!
Während in den Naturwissenschaften, vor allem aber in der Medizin, schon seit langer Zeit solche Datenzentren ausgebildet, gefördert und nicht zuletzt verstetigt wurden, hat dieser Prozess in den Geisteswissenschaften gerade erst begonnen. Dies ist auch eine besondere Chance! Denn während man in den Naturwissenschaften heute die Verbindung der Zentren herstellen und sozusagen eine einheitliche Dachorganisation für interoperationale Dienste mühsam herstellen muss, kann sie in den Geisteswissenschaften vielleicht gerade noch rechtzeitig von Anfang an geschaffen werden. Hier ist vielmehr das umgekehrte Problem vorhanden: Während die zentrale Struktur vermutlich relativ einfach geschaffen werden kann (wenn auch möglichst nicht auf die grüne Wiese), fehlen die verteilten, gesicherten Zentren im Netzwerk. Die vom RfII vorgeschlagene Förderstruktur holt die Geisteswissenschaften nicht da ab, wo sie momentan stehen!
Gerade die für den Erfolg des Gesamtvorhabens vom Diskussionspapier des RfII als ganz wesentlich anerkannten Dienstleister der eigenen Fachcommunities sollen aber im Prozess der NFDI nicht gefördert werden (Es geht […] nicht um die Ertüchtigung vorhandener Zentren, S. 2). Gefördert werden soll stattdessen eine von den jeweiligen Konsortien (Fachwissenschaften) klar getrennte Governance mit aktiver Leitung (top down). Der vom RfII entwickelte Ansatz des polyzentrischen Netzwerkes könnte auch ganz anders verbildlicht werden: Abseits der eigentlichen Geisteswissenschaften wird quasi ein Dach gebaut. Fundament, Wände und Zimmer gibt es allerdings nicht bzw. nur projektförmig oder eben über zusätzliche „Gebühren- und Vergütungsmodelle“. Ob ein solches Gebäude, bei dem bis auf das Dach immer wieder alles neu gezimmert werden muss, wirklich lange halten kann? Derweil stehen die Geisteswissenschaften im Regen und bangen, was aus diesem Überstand wird? Natürlich möchte niemand ein solches Szenario entwickeln oder sich vorstellen müssen. Die bisherigen Vorschläge des RfII klangen für mich immer sehr überzeugend und einleuchtend. Warum wird dies mit der neuen Präzisierung plötzlich so gründlich auf den Kopf gestellt? Hier würde ich die genaueren Argumente des RfII gerne kennen lernen und mich würden die Überlegungen dahinter interessieren. Noch lieber würde ich als Geisteswissenschaflerin über solche Empfehlungen offen diskutieren.
Welch hoher Bedarf an direkten Formen der Zusammenarbeit von Forschungsdatenkuration und Wissenschaft besteht, hat der Berliner Workshop ebenso gezeigt, wie die ganz grundsätzlich zu regelnden Fragen um gemeinsame Standards und Services. Dabei wurde mehr als sichtbar, für die WissenschaftlerInnen bedeutet Forschungsdatenmanagement nach FAIR-Prinzipien die Erzeugung eines neuen Produkts – neben dem bisherigen Buch bzw. Zeitschriftenartikel als Forschungsergebnis. Mit dem gleichen Aufwand wie für das Buch müssen fortan Daten mit allen fachlichen Standards versehen, annotiert, hochwertig aufbereitet und qualitätsgesichert (Doubel Keying) veröffentlicht werden. Das macht Sinn und ist als Vision effektiver Datennutzung unter den Spielregeln guter wissenschaftlicher Praxis zu begrüßen. Aber es macht den Forschungsprozess auch sehr teuer, weil dieser Prozess zusätzliche Arbeitszeit und durchaus nicht unerheblichen Aufwand kostet! Wie sollen diese Kosten nun aufgefangen werden?
Das momentan entwickelte Procedere des RfII lässt den Wissenschaftler bzw. die Wissenschaftlerin mit diesem Aufwand in den Geisteswissenschaften ziemlich allein. Passfähiges fachwissenschaftliches Forschungsdatemanagement vor Ort könnte die Wucht dieses neuen Aufwandes erheblich abfangen! Professionelle Strukturen können Bedürfnisse schnell und Probleme erfolgsorientiert kanalisieren. Es macht aber kaum Sinn, einen solchen Service außerhalb der eigentlichen Forschung anzusiedeln. Diese Leistung kann kein „Infrastrukturunternehmen“ für die Wissenschaft übernehmen, sondern diese Infrastrukturen müssen innerhalb der Wissenschaft gefördert werden! Während Bibliotheken und Archive für die klassischen Aufgabenfelder der Ergebnissicherung, Metadatenhaltung, Lizenzierung und Langzeitarchivierung langfristig gesicherte Infrastrukturen ausgebildet haben, die nun zum Teil umgewidmet und neu definiert bzw. ergänzt werden müssen, fehlen in der geisteswissenschaftlichen Forschung dazu passfähige Infrastrukturen und Personalressourcen für ein Arbeiten Hand in Hand. Oder eben wie das RfII-Papier sagt: für Zusammenarbeit als Chance. Nur direkt mit der Forschung und Lehre verzahnte Akteure können die geforderten fachspezifischen Leistungen für Datenproduktion, Lehre, Standardisierung, Qualitätssicherung/Rezension, Methodik, Software und Analyse erbringen, die eben auch ein Teil der künftigen Infrastrukturen sein sollten.
Kommentar schreiben