DARIAH-DE – Forschen mit digitalen Diensten und Werkzeugen für alle Geistes- und Kulturwissenschaftler

0 Veröffentlicht von Claudio Leone am

Einstieg

Im Zuge der Digitalisierung von Wirtschaft, Gesellschaft und Wissenschaft gewinnen auch die Digital Humanities zunehmend an Bedeutung. Die stark anwachsende Verfügbarkeit digitaler Daten für die Forschung trägt dazu bei, das Interesse an den Methoden und Werkzeugen dieser vergleichsweise jungen Disziplin zu wecken.

EinsteigerInnen in die Digital Humanities stellen sich häufig die Fragen: Was sind die Digital Humanities, welche Forschungsfragen lassen sich mit den Mitteln der Digital Humanities bearbeiten, welche Werkzeuge sind für bestimmte Fragestellungen in unterschiedlichen Fachdisziplinen geeignet, wie ist mit digitalen Forschungsdaten zu verfahren im Hinblick auf Ihre Aufbereitung, Speicherung, Veröffentlichung, Zitierbarkeit und Nachnutzbarkeit?

Die digitalen Geisteswissenschaften lassen sich an der Schnittstelle zwischen Informatik und Geisteswissenschaften verorten. Das Selbstverständnis kann dabei zwischen den beiden Endpolen variieren und entsprechend aufgefasst werden – als unterstützendes Angebot und Erweiterung oder als eigenständige Disziplin mit einem ganz eigenen theoretischen und methodischen Ansatz. Auch die fachliche Zuordnung erweist sich als variabel. So gibt es Universitäten, in denen die Digital Humanities der Informatik und solche, wo sie den geisteswissenschaftlichen Fächern zugeordnet sind. Sieht man von der noch nicht abgeschlossenen Definitionsdebatte ab, so können die Digital Humanities in einer Minimalbeschreibung als Sammelbezeichnung für computergestützte Verfahren und Methoden aufgefasst werden, die im Zuge der digitalen Transformation der Geistes- und Kulturwissenschaften Einzug in die wissenschaftliche Praxis halten. Bereits in der Vergangenheit formulierte Forschungsfragen lassen sich mit neuen Verfahren bearbeiten, aber auch neue Fragestellungen, Konzepte und Ansätze ergeben sich aus den Möglichkeiten computergestützter Analyse großer Datenmengen bis hin zu neuen Formen der Visualisierung und Publikation von Forschungsergebnissen. Entsprechend vielfältig sind auch die Arbeitsfelder und Verfahren.1

DARIAH-DE, als digitale Forschungsinfrastruktur, bietet eine Vielzahl von Diensten und Werkzeugen an, die Forschende aus den Geistes- und Kulturwissenschaften nutzen, auch wenn sie nicht ihren Schwerpunkt in den digitalen Geisteswissenschaften haben oder bisher kaum mit den Digital Humanities befasst waren.

Die von DARIAH-DE angebotenen Dienste und Werkzeuge können zur Unterstützung von Forschungsprozessen eingesetzt werden und ermöglichen zudem die Präsentation, Aufbereitung, Speicherung, Publikation und Verbreitung von Forschungsergebnissen. Mit DARIAH-DE stehen viele Möglichkeiten offen, mit eigenen und von Kolleginnen und Kollegen bereitgestellten Forschungsdaten zu arbeiten. Alle digitalen Werkzeuge und Dienste werden in Zusammenarbeit mit Wissenschaftlerinnen und Wissenschaftlern unterschiedlichster geistes- und kulturwissenschaftlicher Disziplinen erarbeitet und weiterentwickelt. DARIAH-DE versammelt hierzu eine breit gefächerte Expertise: Partner mit unterschiedlichsten geisteswissenschaftlichen und technischen Hintergrund aus Bibliotheken, Universitäten, Akademien der Wissenschaften, Rechenzentren, außeruniversitären Forschungseinrichtungen und technischen Dienstleistern arbeiten eng zusammen. Die Infrastruktur fördert den Austausch von Methoden, Ressourcen, Daten und Erfahrungen und bietet hierzu vielfältige Schulungs- und Serviceangebote. Durch die Einbindung in DARIAH-EU wird zudem auf europäischer Ebene der interdisziplinäre Austausch von Wissen und Expertise gefördert.

Die Wahl der Dienste ist abhängig vom fachwissenschaftlichen Hintergrund und der Forschungsfrage. Darüber hinaus gibt es Dienste, die im Zuge der zunehmenden Verfügbarkeit und Verbreitung von digitalen Forschungsdaten für alle Forschenden von Interesse sind, da sie den Zugang und die Suche nach Forschungsdaten sowie deren Aufbereitung und Veröffentlichung betreffen. Diese Dienste sind in der Forschungsdaten-Föderationsarchitektur von DARIAH-DE zusammengefasst und werden daher im Folgenden eingehender vorgestellt, gefolgt von einem Kurzüberblick über weitere DARIAH-DE-Dienste.

DARIAH-DE Forschungsdaten-Föderationsarchitektur

Die DARIAH-DE Forschungsdaten-Föderationsarchitektur (DFA) versammelt verschiedene Dienste und Anwendungen, um ein möglichst komfortables Forschungsdatenmanagement zu ermöglichen. Sie besteht aus dem DARIAH-DE Repository, der Collection Registry, dem Data Modeling Environment und der Generischen Suche. All diese Komponenten sind miteinander modular verknüpft und decken den Bedarf von Forschenden zur Verwaltung, Speicherung, Beschreibung, Veröffentlichung, Referenzierung und Recherche von Forschungsdaten2ab. Der modulare Aufbau der DFA ermöglicht es Forschenden, je nach Bedarf, nur einzelne Bereiche oder alle Komponenten zu nutzen. User Guides und How-to articles stehen den Forschenden im öffentlichen DARIAH-DE Wiki unterstützend zur Verfügung.

dfa_de

DARIAH-DE Repository

Im DARIAH-DE Repository können Forschende Ihre Daten langfristig, sicher und nachhaltig speichern und veröffentlichen.3 Als Einstiegspunkt in das digitale Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten bietet DARIAH-DE mit dem Publikator Forschenden eine benutzerfreundliche Weboberfläche zum Einspielen von Daten.4

Über die Weboberfläche legen sie zunächst eine Kollektion an, die als übergeordnete Einheit der Aggregation ihrer Forschungsdaten dient und es ihnen erlaubt, ihre Daten zu einem Thema zusammenzufassen sowie als eine Sammlung zusammengehöriger Objekte zu beschreiben. Zur Beschreibung ihrer Kollektion, als auch ihrer hochgeladenen Dateien, steht den Forschenden Dublin Core Simple als Metadatenstandard zur Verfügung. Mit wenigen Pflichtangaben können sie ihre Daten für eine Veröffentlichung vorbereiten. Bis dahin werden ihre Daten in ihrem eigenen Speicherbereich, dem OwnStorage, sicher gespeichert. Sobald sie ihre Daten dann veröffentlichen, erhalten diese einen eindeutigen und dauerhaften digitalen Identifikator (DOI – Digital Object Identifier). Diese Persistenten Identifikatoren können sie zur Referenzierung ihrer Kollektion als Ganzes und jedes einzelnen darin enthaltenen Objekts nutzen. Über diese Referenzierung sind die veröffentlichten Daten dauerhaft zitierbar und öffentlich zugänglich.

Collection Registry

Wenn die Forschenden die Sichtbarkeit ihrer Daten weiter erhöhen, die Beschreibung der Daten ausführlicher und damit für die Wissenschaftscommunity zugänglicher gestalten wollen, bietet DARIAH-DE ihnen mit der Collection Registry eine weitergehende, benutzerfreundliche Möglichkeit an. Durch die Registrierung und erweiterte Beschreibung ihrer Kollektionen sind diese nun nicht nur über Persistente Identifikatoren (DOIs) referenzierbar, sondern sind zusätzlich über die Generische Suche von DARIAH-DE recherchierbar.

Hierbei lassen sich aber nicht nur im DARIAH-DE Repository veröffentlichte und mit DOIs versehene Daten verzeichnen, sondern auch Daten die bereits an anderer Stelle veröffentlicht oder gesichert sind, auch wenn sie nicht in digitaler Form vorliegen. Denn in der Registry werden nicht die Daten selbst, sondern nur Beschreibungen (Metadaten) und Referenzen auf die Daten gespeichert sowie Angaben zur Zugriffsmethode verzeichnet. Über die Generische Suche stehen diese Beschreibungen – öffentlich zugänglich – anderen Forschenden zur Recherche zur Verfügung.

Für bereits im DARIAH-DE Repository veröffentlichte Daten wird mit der Veröffentlichung zeitgleich auch ein Entwurf einer Kollektionsbeschreibung in der Collection Registry angelegt, den Forschende anschließend erweitern und veröffentlichen können. Hierfür steht ein umfangreiches über Dublin Core Simple hinausgehendes Beschreibungsschema mit entsprechenden Eingabefeldern zur Verfügung, das DARIAH Collection Description Data Model –DCDDM.

Generische Suche

Mit der Entwicklung der Generischen Suche verfolgt DARIAH-DE das Ziel, den Geistes- und Kulturwissenschaften und ihren Forschenden ein Recherchewerkzeug zur Verfügung zu stellen, welches sie an die eigenen Bedürfnisse anpassen können.

Die Generische Suche speist sich aus unterschiedlichen Quellen und ermöglicht eine themenübergreifende Recherche. Sie ist ohne Anmeldung verwendbar und bietet vielfältige Anpassungsoptionen.  Nutzer können die Quellen für die Suche auswählen und mit der Funktion „myCollections“ sich auch eine individuelle Auswahl an Sammlungen zusammenstellen, um nur bestimmte präzise definierte Metadatensätze der Collection Registry zu durchsuchen. Diese Zusammenstellung können sie zusätzlich mit anderen Forschenden teilen. Die angebotenen Anpassungen erlauben ihnen insgesamt durch eine Kombination aus Tiefen- und Breitensuche die Granularität der eigenen Suche dynamisch zu variieren. Auch Sammlungen mit unterschiedlichen Beschreibungsschemata lassen sich nach einer Zuordnung der zugrundeliegenden Elemente verknüpfen und werden gemeinsam durchsuchbar. Hierfür steht eine weitere modulare Komponente der DARIAH-DE Datenföderationsarchitektur zur Verfügung, das Data Modeling Environment.

Data Modeling Environment

Innerhalb des Data Modeling Environment (DME) können Datenmodelle und Verbindungen zwischen ihnen beschrieben werden. Häufige Anwendungsfälle sind, dass Daten zwischen unterschiedlichen Metadatenstandards ausgetauscht werden sollen und Daten aufbereitet werden, um sie in neue Strukturen zu integrieren oder in bestimmten Werkzeugen sowie Diensten nutzen zu können. Auch die Erweiterung der Beschreibung der Daten, um Hintergrund- und Expertenwissen zu einer Datensammlung explizit und nachvollziehbar zu gestalten, ist ein möglicher Anwendungsfall.

Das DME bietet für die Datenbeschreibung und -strukturierung eine webbasierte Anwendung, in der bereits vorhandene Datenmodelle zur Beschreibung ausgewählt, eigene angelegt oder hochgeladen werden können, um die einzelnen Beschreibungselemente miteinander zu korrelieren.

DARIAH-DE Dienste im Überblick

Kollaboratives Arbeiten und Projektmanagement

 Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge
Cloudshare … ermöglicht Dateien auf einem Server per Browser oder einem Klienten zu speichern, mit anderen Forschenden zu teilen oder auf andere Geräte zu überragen sowie ortsunabhängig zu synchronisieren.
Etherpad … ist ein webbasierter Editor zur kollaborativen, standortunabhängigen Texterstellung, der sowohl den Import bereits bestehender Dateien als auch den Export in verschiedene Formate erlaubt.
OpenProjects … ist ein webbasiertes kollaboratives Projektmanagementsystem. Es ermöglicht die Unterstützung des kompletten Projektlebenszyklus.
Wiki … bietet eine kollaborative Informationsplattform, auf der Forschende zum Beispiel im Rahmen von Projekten, Informationen, Ergebnisse und Daten standortunabhängig einspeisen, bearbeiten und austauschen können.  Ein Rechte- und Zugriffsmanagement erlaubt es, eigene interne sowie öffentlich zugängliche Bereiche einzurichten.

Forschungsdaten und Forschungsdatenmanagement

 Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge
Collection Registry …stellt einen Katalog von Sammlungen mit ihren Beschreibungen dar, in dem Kollektionen beschrieben und Metadaten und Zugriffsmöglichkeiten verzeichnet werden können und somit über die Generische Suche von DARIAH-DE öffentlich zugänglich recherchierbar werden.
ConedaKOR … verwaltet und präsentiert akademische Objektsammlungen aus den bildbasierten Kultur- und Geisteswissenschaften.
Data_Modelling_Environment_icon Data Modeling Environment … dient der Modellierung und Assoziation von Daten und Metadaten.
DARIAH-DE_Repository_Icon DARIAH-DE Repository …. ermöglicht als digitales Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten, Forschungsdaten nachhaltig und sicher zu speichern, sie mit Metadaten zu versehen und referenzierbar zu veröffentlichen sowie zusätzlich durch die Generische Suche aufzufinden.
Generische_Suche_Icon Generische Suche … bietet eine übergreifende Suchmöglichkeit im Katalog der wissenschaftlichen Sammlungen, die eine Kombination von Breiten- und Tiefensuche in über 3 Millionen in der DARIAH-DE Collection Registry verzeichneten Dokumenten erlaubt.
Publikator_Icon Publikator … dient dem Hochladen und Veröffentlichen von Daten in das DARIAH-DE Repository.
TextGrid_Repository_Icon TextGrid Repository … ist ein fachwissenschaftliches Langzeitarchiv und Teil der Virtuellen Forschungsumgebung TextGrid, das eine Open Source-Software für die kollaborative Erstellung und Publikation z.B. digitaler Editionen auf XML/TEI-Basis anbietet.

Annotieren, Analysieren und Visualisieren

 Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge
Cosmotool_Icon CosmoTool … fasst biographische Informationen aus unterschiedlichen Quellen zu nationalen und internationalen Bewegungsprofilen historischer Persönlichkeiten zusammen.
DPProWrapper_Icon DKProWrapper … ermöglicht die Extraktion von linguistischen Informationen aus Texten zur maschinellen Verarbeitung natürlicher Sprachen.
Geo-Browser_Icon Geo-Browser … analysiert als webbasiertes Werkzeug Raum-Zeit-Relationen von Daten und Quellensammlungen und ermöglicht Ihre visuelle Darstellung, vor dem geographischen Hintergrund einer Auswahl historischer Karten.
Digivoy_Icon Digivoy …. ermöglicht  vielseitige explorative und analytische Zugänge zu beliebigen Texten oder Textsammlungen und stellt hierfür mehrere webbasierte „Voyant Tools“ zur Verfügung. Durch die Anbindung an TextGrids Digitaler Bibliothek stehen vorab schon Werke von 600 deutschsprachigen Autoren hierfür zur Verfügung.
SemToNotes … dient der Untersuchung von räumlich-topologischen Beziehungen zwischen semantisch aufgeladenen Teilflächen eines Bildes, ist ein Annotations- und Retrievalwerkzeug zur Untersuchung der räumlichen Komposition eines Bildes.
Topics … ist auf die Bedürfnisse der Literaturwissenschaft zugeschnitten und bietet eine Python-Bibliothek für Topic Modeling.
WebApp_Orte_jüdischer_Geschichte_Icon Webapp Orte jüdischer Geschichte … ist eine stetig funktional und inhaltlich erweiterte Web-App, die insbesondere ortsbezogene Informationen u.a. zur jüdischen Geschichte enthält.

Edieren

 Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge
MEI_Score_Editor_Icon MEI Score Editor … zeigt als Desktop-Tool MEI-kodierten Musikdateien an und ermöglicht ihre Bearbeitung. Es bedient Forschungsfragen in der Musikologie.
TextGrid_Laboratory_Icon TextGrid Laboratory … ist eine virtuelle Forschungsumgebung für die Geisteswissenschaften, die vielfältige Open-Source-Werkzeuge und -Services zur Unterstützung des gesamten Forschungsprozesses, insbesondere bei der Erstellung digitaler Editionen bietet.

Community, Support, Schulungsmaterialien

DARIAH-DE ist nicht nur eine digitale Forschungsinfrastruktur, sondern auch eine soziale Infrastruktur, die den Community-Austausch und ihre Vernetzung über diverse Schulungs-/Lehrmaterialien, Beratungsangebote sowie über Veranstaltungen befördert.

DARIAH-DE entwickelt sein Informationsangebot beständig weiter und vermittelt es multimedial.  Neben dem DHd-Blog, der über aktuelle Themen und Entwicklungen informiert, versammelt der DHd-Kanal auf YouTube Clips rund um die Themen Digital Humanities im deutschsprachigen Raum. Dort finden sich auch vielfältige Videos rund um die Aktivitäten der Forschungsverbünde TextGrid und DARIAH-DE, zu Veranstaltungen, Tutorials und insbesondere zu den Themen virtuelle Forschungsumgebungen, Forschungsdatenmanagement und digitales Edieren.

Mit der Bibliographie Doing Digital Humanities stellt DARIAH-DE Forschenden, Studierenden und Interessierten eine Auswahl an Einführungswerken sowie weiterführende Literatur zu diversen Themenfeldern der digitalen Geistes- und Kulturwissenschaften zur Verfügung.

Das als „Living Book“ konzipierte Handbuch Digital Humanities bietet einen erste Einführung in die Thematik. Es ist im Rahmen eines dreitägigen Book Sprints von DARIAH-DE entstanden, der 2015 in der Open Knowledge Foundation in Berlin stattfand. Das Besondere in diesem Zusammenhang stellt die Nähe zur fachwissenschaftlichen Praxis dar und dass es in den weiteren Fassungen ergänzt wird. Der Leser findet hier Projekte und Werkzeuge detailliert vorgestellt, kann seine Kenntnisse auffrischen und neue Aspekte kennenlernen, zudem werden Lösungsvorschläge für typische Fragen formuliert.

In der nun mehr siebenjährigen Tätigkeit des Forschungsverbundes sind Publikationen und Präsentationen rund um DARIAH-DE entstanden, die Einblicke in vielfältige Themen gewähren.

Wer gerne auf dem Laufenden blieben möchte, sei auf die Tweets von @DARIAHde verwiesen.

Gerne stehen wir Ihnen über info@de.dariah.eu für Rückfragen oder Anfragen zur Verfügung!

 

 

  1. Vgl. hierzu die Erörterung zur Eingrenzung der Digital Humanities sowie den Überblick zu ihren Themenfeldern und Arbeitsmethoden in: Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Hrsg.), Digital Humanities – Eine Einführung, Stuttgart: J.B. Metzler Verlag, 2017[]
  2. Für Informationen zum Begriff „Forschungsdaten“ und dem „Research Data Life Cycle“ im Kontext von DARIAH-DE siehe https://de.dariah.eu/weiterfuhrende-informationen[]
  3. Das DARIAH-DE Repository ist am 06.12.2017 offiziell als Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten gestartet. Das Humanites Data Center (HDC) stellt als Kooperation der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB) den langfristigen Betrieb des Repositorys sicher: https://www.uni-goettingen.de/de/3240.html?tid=604[]
  4. Ein erster Erfahrungsbericht zur Veröffentlichug von eigenen Forschungsdaten findet sich bereits hier im DHd-Blog: http://dhd-blog.org/?p=8798[]

Kommentar schreiben