The next big thing will be a lot of small things – Serviceorientierung als Modell für die Infrastrukturlandschaft
von Fabian Cremer und Thorsten Wübbena
Die Diversität der geisteswissenschaftlichen Forschung spiegelt sich auch in der Landschaft der Forschungsinfrastrukturen wieder, die bisweilen als zersplittert charakterisiert wird.((RfII – Rat für Informationsinfrastrukturen: Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland, Göttingen 2016, http://www.rfii.de/?p=1998.)) Als Mittel für die Integration werden derzeit vor allem Steuerungsinstrumente und Rahmenbedingungen top-down vorangetrieben (RFII((RfII – Rat für Informationsinfrastrukturen: Zusammenarbeit als Chance. Zweiter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland, Göttingen 2018, http://www.rfii.de/?p=2529.))), die notwendigen Adaptionsprozesse für die bestehenden Infrastrukturen sind bisher jedoch nur wenig ausgearbeitet. Zudem bleibt die Betriebsfinanzierung dieser Infrastrukturen weiter ungeklärt.((Vgl. Patrick Sahle: RfII-Diskussionsimpuls 2018: Auf dem Weg zu einem Netzwerk mit Kanten aber ohne Knoten?, DHd-Blog, 18.03.2018, https://dhd-blog.org/?p=9547 und Katrin Moeller: RfII-Diskussionsimpuls 2018: Forschungsdaten(infrastrukturen) sind der Mittelpunkt von Forschung!, DHd-Blog, 20.03.2018, https://dhd-blog.org/?p=9556.)) Neben gemeinsamen Standards und Schnittstellen bedarf es für die vorhandenen „Fragmente“ der Infrastrukturlandschaft häufig jedoch auch einer konzeptuellen Veränderung, um als Teil eines Ganzen zu funktionieren und zu bestehen. Das aus der Informationstechnologie entwickelte „as-a-Service“-Prinzip((Vgl. dazu Peter Mell und Tim Grance: The NIST definition of cloud computing, 2011, NIST Special Publication 800-145, http://faculty.winthrop.edu/domanm/csci411/Handouts/NIST.pdf.)), kann hier fruchtbare Anregungen und kritische Fragen liefern. Dieser Blogbeitrag basiert auf einer Einreichung zum Symposium „Forschungsinfrastrukturen in den digitalen Geisteswissenschaften. Wie verändern digitale Infrastrukturen die Praxis der Geisteswissenschaften?“ (26.–28.09.2018, Universität Bayreuth)((Die Vortragseinreichung der Autoren konnte nicht berücksichtigt werden und erscheint daher hier im Vorfeld als möglicher Impuls für diese und weiterführende Diskussionen.)) und skizziert das „aaS“-Prinzip auf verschiedenen Ebenen der Forschungsinfrastrukturen und mehrerer Entwicklungsschritte einer aus dem Fach Kunstgeschichte entstandenen Softwaresystems.
Lokale Dienste mit serviceorientierter Architektur
Im Frankfurter Kunstgeschichtlichen Institut wurde mit dem quelloffenen Datenbanksystem ConedaKOR eine Software entwickelt, um u.a. das in der Fachwissenschaft relevante Beziehungsgeflecht zwischen Werken und ihren Kontexten abbilden zu können.((ConedaKOR: https://github.com/coneda/kor.)) Die digitale Bildersammlung hat sich hierbei im Laufe der Zeit zu einer Wissensdatenbank und einem Instrument zur Vermittlung kunsthistorischer Kompetenzen weiterentwickelt. Die Software erfüllt in diesem Szenario sehr spezifische Anforderungen der kunsthistorischen Forschung, ohne jedoch als spezifische Anwendung konzipiert zu sein. Das Konzept einer modularen, serviceorientierten Softwarearchitektur ermöglicht es, die Spezialisierung über Konfigurationsmöglichkeiten und einzelne kleinere Dienste zu erreichen. Das Datenmodell ist innerhalb der Applikation frei konfigurier- und erweiterbar, erlaubt sowohl die Kompatibilität mit einer Top-Level-Domäne (CIDOC CRM) als auch die lokale Ausprägung.((Vgl. Sven Peter: Abbildung relationaler Daten auf die Ontologie des CIDOC CRM, 2015, DOI: https://doi.org/10.11588/artdok.00003454.)) Ein rollen- und sammlungsbasiertes Rechtemanagement erlaubt hier die – in Verbundprojekten und institutsweiten Anwendungen so kritische – granulare Rechtekontrolle. Diese spezifische Konfiguration, Verwaltung und Betreuung (Datenmodellierung, Objekterschließung usw.) begründen das Bestehen und die Weiterentwicklung dieser lokalen Infrastrukturen als Komplement zu zentralen, generischen Werkzeugen oder Portalen. Der technische Betrieb dieser webbasierten Anwendungen vor Ort erfordert jedoch Ressourcen und Kompetenzen, die vielen Projekten und Instituten nicht zur Verfügung stehen. Als Antwort auf dieses Szenario wurde daher in Kooperation mit DARIAH-DE das Frankfurter Datenbanksystem zu einem „Software-as-a-Service“-Modell weiterentwickelt und steht als erste community-driven Software über DARIAH-DE zur Verfügung.((Thorsten Wübbena: ConedaKOR als „Software as a Service“-Angebot bei DARIAH-DE, DHd Blog, 13.10.2016, http://dhd-blog.org/?p=7268.))
Zentrale Dienste durch Software-as-a-Service
Die Entwicklung eines „aaS“-Modells erwies sich als Voraussetzung, um unabhängige Nachnutzung und nachhaltigen Betrieb zu realisieren. Die Grundlage für die Aufnahme in das Diensteangebot von DARIAH-DE bildet der DARIAH-DE-Service Life Cycle. Dieser formale Workflow beschreibt in mehreren Stufen die Kriterien und Vorgehensweisen für eine schrittweise Entwicklung einer Software zu einem Service.((DARIAH-DE: Report zur Aufnahme zukünftiger neuer Dienste (R 3.2.7), 29.02.2016, https://wiki.de.dariah.eu/download/attachments/14651583/R3.2.7.pdf.)) Im Zuge der Serviceentwicklung von ConedaKOR wurde zunächst eine Prüfung durch DARIAH-DE durchgeführt, in dessen Verlauf die fachwissenschaftliche und die informationstechnologische Seite unter verschiedenen Aspekten durchleuchtet wurden. Nach positivem Ausgang dieses Verfahrens erfolgte die Klärung der zukünftigen Rollen von DARIAH-DE und dem Deutschen Forum für Kunstgeschichte Paris (DFK Paris)((Das DFK Paris setzte zu diesem Zeitpunkt bei diversen Projekten bereits auf ConedaKOR, woraus auch eine intensive Arbeit an der Weiterentwicklung des Codes entstand und aus dessen Reihen letztlich der „aaS“-Vorschlag eingegangen war.)). An die Bewertung und Aufgabenverteilung schließt sich die Abschätzung von Aufwand und Kosten für Umsetzung und Betrieb an (inkl. einer Kalkulation zur finanziellen Belastung für potentielle Endanwender*innen). Die Prozessbegleitung durch DARIAH-DE beschreibt hier ein erfolgreiches Leistungsangebot einer übergreifenden, koordinierenden Infrastruktur zur Integration bestehender Systeme.
Die Forschungsinfrastruktur DARIAH-DE übernimmt hier nicht die Aufgabe der grundständigen Entwicklung von Infrastrukturkomponenten, sondern bietet ein Rahmenwerk aus formalisierten Abläufen, festen Zuständigkeiten und einem Kompetenznetzwerk, in dem externe Softwareentwicklungen als Dienstangebot skaliert oder weiterentwickelt werden können. Damit richtet sich diese Ebene der Forschungsinfrastruktur nicht mehr an den Kreis der Endanwender*innen und Nutzer*innen, sondern an die Verantwortlichen der Projekte und Institutionen, die selbst im Bereich der Entwicklung von Infrastruktur und Informationssystemen agieren. Dieses meist nur lokal vorhandene Potential lässt sich mit übergreifenden Strukturen und weiterer Investition auch in der Form einer nationalen und internationalen Forschungsinfrastruktur entfalten, wie der hier geschilderte Anwendungsfall ConedaKOR demonstriert. Ein Paradebeispiel liefert das Vorhaben „Textdatenbank und Wörterbuch des Klassischen Maya“, das mit dem Dienstangebot ein Bildarchiv mit unikalem Material realisiert: „Maya Image Archive“.((Vgl. Christian Prager: „Maya Image Archive“ online: digitales Bildarchiv für Mayahieroglyphen, -kunst und -architektur, DHd-Blog, 31.08.2018, https://dhd-blog.org/?p=10411.))
Dezentrale Dienste durch offene Datenquellen
Durch maschinelle Lesbarkeit und Schnittstellen verändern offene Kulturdaten die Praktiken ihrer Nutzung. Eine unmittelbare Nachnutzung erlaubt es Forschungsvorhaben, Ressourcen in Weiterführung und Anreicherung statt repetitiven Neuaufbau zu investieren. In einem Projekt am Deutschen Forum für Kunstgeschichte Paris wurde daher ein Workflow entwickelt, der die Verknüpfung lokaler Daten mit Wikidata, der weltweit größten freien Datenbasis ermöglicht.((Thorsten Wübbena: Wikidata: Nutzungsmöglichkeiten und Anwendungsbeispiele für den Bereich Digital Cultural Heritage, DHd Blog, 25.02.2018, https://dhd-blog.org/?p=9336.)) Die Implementierung (Schnittstellen, Webservices, Browser-Add-on) zielt vorrangig darauf ab, einen nutzerorientierten Service anzubieten. Die Kernidee basiert auf einer Nachnutzung bereits vorhandener Datenobjekte und deren Erweiterung durch fachspezifische Forschungsprojekte direkt in Wikidata, bei optionaler Übertragung in ein eigenes ConedaKOR-Repositorium, um den Datenbestand als Subset verarbeiten und sichern zu können. Die projekttypische Begrenztheit von Ressourcen wird auf die Erhebung der spezifischen, neuen Daten konzentriert, die in Wikidata dann zugleich wieder frei verfügbar werden und den Vorteil der Anreicherung erfahren. Das führt auch zu einer breiteren Sichtbarkeit des Vorhabens und ermöglicht eine Nachnutzung der Forschungsdaten auch außerhalb der Wissenschaft. Zugleich gewährleistet die Nutzung des eigenen Systems eine Erweiterung der Datenbasis mit geschütztem oder sensiblem Material im Kontext des Projekts – in der Kunstgeschichte durch die digitalen Repräsentationen der Untersuchungsgegenstände ein Standardfall.
Kleine Teile des großen Bildes
Diese Kombination aus Forschungssoftware mit spezifischen Funktionalitäten (serviceorientierte Softwarearchitektur), einem vertrauenswürdigen und kompetenten Provider (serviceorientierte Forschungsinfrastruktur), sowie eines externen Datenbestandes (serviceorientierte Datensammlung), ermöglicht eine flexible und wissenschaftsgetriebene Nutzung digitaler Infrastrukturen. Zugleich steht dieser modulare Aufbau beispielhaft für eine verteilte Forschungsinfrastruktur, deren Services sich bedarfsspezifisch zusammensetzen: “The next big thing will be a lot of small things!”((Thomas Lommée, Wandgestaltung Universität Ghent, 2015, vgl. Beitragsbild.)) Die Voraussetzungen für dieses Szenario bilden indes große Herausforderungen: eine essentielle Stärkung der wissenschaftlichen Softwareentwicklung((Vgl. Simon Hettrick: “Research Software Sustainability: Report on a Knowledge Exchange Workshop”, The Software Sustainability Institute, 2016, http://repository.jisc.ac.uk/6332/1/Research_Software_Sustainability_Report_on_KE_Workshop_Feb_2016_FINAL.pdf und die DHd-AG „Research Software Engineering in den Digital Humanities (DH-RSE)“, https://dh-rse.github.io/.)), eine grundständige Finanzierung übergreifender Strukturen , und die Förderung freien Zugangs zu der Kultur- und Forschungsdaten in maschinenlesbarer und standardisierter Form.((Siehe hierzu das Memorandum “Digitalisierung von Kulturgut”: Lisa Klaffki: “Memorandum: Digitalisierung von Kulturgut”, DHd-Blog, 17.05.18, https://dhd-blog.org/?p=9849 sowie zur Öffnung der Kulturdaten: Helene Hahn: “Kooperativ in die digitale Zeit – wie öffentliche Kulturinstitutionen Cultural Commons fördern. Eine Einführung in offene Kulturdaten”, Berlin 2016, urn:nbn:de:0297-zib-59131.))
Kommentar schreiben