Wikidata: Nutzungsmöglichkeiten und Anwendungsbeispiele für den Bereich Digital Cultural Heritage

1 Veröffentlicht von Thorsten Wübbena am

Dieser Text entstand aus Anlass des gleichlautenden Workshops auf der DHd Konferenz 2018.1

„Wikidata is not about truth – it’s about sources!“. Dieser Satz aus Maarten Dammers Vortrag „Wikidata for GLAMs“, den er auf der jüngsten Konferenz „Zugang gestalten!“ hielt2, beschreibt sehr gut, worin das Potenzial der frei bearbeitbaren, mehrsprachigen Wissensdatenbank besteht. Es geht nicht um Deutungen, vielmehr ist das Ziel, den Wissensstand zu einem definierten Zeitpunkt belegbar abzubilden. Aktuell schreiben ca. 20.000 aktive NutzerInnen an dieser Sammlung strukturierter Daten mit und sorgen dafür, dass die Zahl von derzeit mehr als 45.000.000 Datensätzen stetig ansteigt.3 Das Modell von Wikidata weist eine enorme Flexibilität auf, ist entsprechend erweiterbar und die Daten stehen unter der CC0 1.0-Lizenz, womit sie frei von urheberrechtlichen und verwandten Schutzrechten sind. Neben der Lesbarkeit für Mensch und Maschine sind an den Objekten zahlreiche Identifikatoren aufgeführt, die in Datenbanken von externen Organisationen verwendet werden und – spätestens hier wird es für die Kunstgeschichte spannend – Wikidata führt mehr Kunstwerke auf, als Repositorien wie z.B. die GND oder CONA4.
Rahmenbedingungen also, die diverse Szenarien der Nachnutzung eröffnen (auch jenseits der Verwendung in Wikidata-Schwesterprojekten wie Wikipedia et al.).

Idee

Vor diesem Hintergrund und noch sehr von den (GLAM-)Diskussionen auf der WikidataCon2017 geprägt, reifte am Deutschen Forum für Kunstgeschichte Paris und dem Kunstgeschichtlichen Institut der Goethe-Universität Frankfurt der Gedanke, das o.g. Potenzial (noch) besser zu nutzen. Nachdem wir bereits seit 2016 ein Skript einsetzen, welches vorhandene Relationen zwischen Entitäten in Wikidata mit denen unserer Inhalte im eigenen Datenbanksystem vergleicht und ergänzt5, sollte nun ein weiterer Schritt erfolgen. Denn aus der Beobachtung heraus, dass in vielen neu startenden, datenbankgestützten Projekten jedes Mal aufs Neue ein Grundstock bereits vorliegender Informationen angelegt wird6, könnte Wikidata eine Möglichkeit bedeuten, die begrenzten Ressourcen eines Projekts in weitaus spezifischere Arbeit zu investieren. Aus demselben Grund könnte sich der Einsatz von Wikidata als externe Datensammlung selbstverständlich auch für das Tagesgeschäft in kunsthistorischen Einrichtungen mit ihren zahlreichen Bilddatenbanken in den institutseigenen Diatheken und Bildstellen lohnen.
Es geht hierbei aber nicht nur um die einbahnstraßenhafte Nutzung der Daten aus der Wikidata, denn die in den Instituten und Projekten erhobenen Informationen könnten auch wieder in die Wikidata-Sammlung hineingeschrieben werden und kämen damit der Allgemeinheit, der Sichtbarkeit und dem Gedanken der Nachnutzung (=Nachhaltigkeit) zugute. Eine in der Tat verführerische Idee, wenn in der Kunstgeschichte nicht der zentrale Gegenstand der Untersuchung das Bild wäre, welches zugleich Thema einer oft schwierigen Rechtelage ist. Und somit entsteht die Notwendigkeit, zumindest dort ein eigenes Repositorium für die Bilddaten zu betreiben, wo diese aus rechtlichen Gründen nicht gezeigt werden dürfen oder aus forschungsrelevanten Überlegungen heraus (z.B. bei Aufnahmen, die im Projektkontext noch auszuwerten sind) vorerst nicht gezeigt werden sollen.
Aus diesem Dilemma entstand die Überzeugung, dass wir zwei Welten zusammenbringen mussten – Wikidata und das eigene Datenbanksystem7.

Umsetzung. Eine Browser-Extension als Brücke

Um diese angestrebte Kopplung bei größtmöglicher Kompatibilität und zugleich geringem Aufwand (Entwicklung und Anwendung) zu erreichen, setzen wir auf eine Browser-Erweiterung8. Verfügbar für Firefox und Chrome wird nach der Installation des Add-ons bei jedem Besuch einer Wikidata-Seite nachgesehen, welche ID dort vorhanden ist.9. Die Extension meldet, wenn eine korrespondierende Entität in der eigenen Datenbank vorhanden ist10 und das a) Abbildungen dazu vorliegen, die bereits im Extension-Fenster als Vorschaubild erscheinen und im eigenen Repositorium angezeigt werden können oder b) es noch keine zugehörigen Abbildungen gibt und – falls verfügbar – nun ins eigene System hochgeladen werden können (Abb. 01 a/b).

Abb. 01a

Abb. 01b

Damit ist die Nutzung der Datenbasis in Wikidata möglich und die häufig schwierige Rechtesituation der Abbildungen wird bei diesem Vorgehen weiterhin im System der NutzerInnen geklärt11. Dieser Ablauf würde beinhalten, dass neu erarbeitete Informationen, die in Wikidata abgelegt werden können, auch direkt dort hineingeschrieben werden. Damit erhält – wie oben bereits angedeutet – spezifisches Wissen aus dem jeweiligen Vorhaben eine Sichtbarkeit in Wikidata und kann entsprechend nachgenutzt werden.

Darüber hinaus ist dann auch die parallele Übernahme von Wikidata-Inhalten in die eigene Datenbank möglich, womit aus der Anwendungsperspektive das eine getan, aber das andere nicht gelassen werden muss. Denn wenn die zugehörige Entität einer entdeckten Wikidata-ID noch nicht im eigenen System vorhanden ist, bietet die Extension eine konfigurierbare Importmöglichkeit an (Abb. 02).

Abb. 02

Bei diesem Import wird ferner nachgesehen, ob über Relationen zu verbindende Entitäten bereits in der eigenen Installation vorhanden sind und im positiven Fall werden diese Verbindungen gleich mit angelegt. Im obigen Beispiel wird somit gleich eine Verknüpfung zwischen dem Werk (Die Alexanderschlacht) und der Person (Albrecht Altdorfer) erzeugt.

Ausblick

Voraussetzung für das beschriebene Vorgehen ist selbstverständlich die Bereitschaft, die Daten im Netz, in Wikidata, vorzuhalten, zu ergänzen und nicht mehr ausschließlich im eigenen Datenbanksystem. Damit ergeben sich – neben technisch zu berücksichtigenden Aspekten – natürlich Fragen, die z. B. die Redaktionshoheit betreffen. Welche neuen datenkuratorischen Wege sind zu gehen, welche Prozesse ergeben sich, wenn nun eine größere Gruppe an den Datensätzen mitschreibt? Hier könnte z. B. der in der Wikidata community diskutierte Ansatz der „signed statements“ interessant werden, womit Institution ihre Aussagen mit einem Label versehen könnten.12
Sicher ist, dass – neben einem zweckmäßige(re)n Einsatz von Ressourcen – auf diesem Weg womöglich eine Reduzierung der isolierten Datenbestände einer Fachdomäne erfolgen kann, wie sie derzeit als Datensilos eben immer noch als (ein) Ergebnis von zeitlich begrenzten Vorhaben zurückbleiben.


1. Begleitseite zum Workshop.

2. „Zugang gestalten!“ – 7. internationale Konferenz am 19./20. Oktober 2017 in Frankfurt am Main, Deutsche Nationalbibliothek, Folien von Maarten Dammers).

3. Siehe hierzu „Pointers to all sorts of statistics. About Wikidata content, the Wikidata community, type of content, etc.“↩

4. Siehe hierzu Georg Schelbert: „Wikidata als offene, vielsprachige und eindeutige Metanormdaten-Ressource im Internet nutzen“, 2017, S. 14

5. Siehe dazu auch den Blogbeitrag „Daten aus Wikidata in ConedaKOR importieren“, 9.7.2016

6. Personen, Werke, Orte etc.

7. In der Folge bezieht sich die Darstellung auf eine ConedaKOR-Installation (https://github.com/coneda/kor bzw. https://dhd-blog.org/?p=7268), aber die hier beschriebene Erweiterung ließe sich auch für andere Datenbanksysteme entwickeln.

8. Für die Umsetzung sei hier Moritz Schepp (https://wendig.io) besonders gedankt.

9. Die Extension reagiert aber nicht nur auf Wikidata, sondern auch beim Browsen auf Wikipedia.

10. Dazu muss eine zugehörige Wikidata-ID im eigenen System abgelegt sein. Alternativ auch andere Identifier, über welche die Wikidata-IDs importiert werden können.

11. Letzten Endes handelt es sich bei dem beschriebenen Vorgehen um einen Workaround, da die Forderung weiterhin lautet: Das Kulturerbe muss in seinem gesamten Spektrum ins Netz.

12. https://phabricator.wikimedia.org/T138708

Ein besonderer Dank gilt an dieser Stelle Fabian Cremer für die kritischen Kommentare zu diesem Beitrag.

Ein Kommentar Kommentar schreiben
  • no image

    Wikidata x ConedaKOR | CONEDA

    Antworten

    […] erschien drüben im DHd-Blog unter dem Titel „Wikidata: Nutzungsmöglichkeiten und Anwendungsbeispiele für den Bereich Digital Cultural Herita… ein Beitrag aus Anlass des gleichlautenden Workshops, den ich gemeinsam mit Claudia Müller-Birn, […]

Kommentar schreiben