Wissenschaftliche Annotationen: Formen – Funktionen – Anforderungen
von Michael Bender, Luise Borek, Thomas Kollatz und Ruth Reiche
unter Mitarbeit von Rainer Becker, Robert Casties, Eric Decker, Jochen Graf, Canan Hastik, Heinz-Günter Kuper, Jens-Martin Loebel, Claudia Müller-Birn, Andrea Rapp, Martin Raspe, Elisabeth Steiner und Dulip Withanage
1. Einleitung
Passende infrastrukturelle Rahmenbedingungen sind die Voraussetzung für digitales fachwissenschaftliches Annotieren, gerade hier bestehen jedoch noch (unerfüllte) Anforderungen, um die Potentiale digitaler Annotationen voll auszuschöpfen. Dies wurde in zwei aufeinander aufbauenden Diskussionsrunden deutlich: Am 23. und 24. März 2015 fand an der Technischen Universität Darmstadt der von DARIAH-DE organisierte Expertenworkshop Annotation of Digital Media: Infrastructural Needs (Round Table II) statt, der die Ergebnisse einer konstruktiven Diskussionsrunde wieder aufnahm, die im Juni 2014 in Heidelberg von der Heidelberg Research Architecture (HRA) ausgerichtet wurde (Round Table I). Neben der definitorischen Abgrenzung, also der Frage, was Annotationen sind, standen schon in diesem ersten Workshop Differenzierungen zwischen manuell und maschinell generierten Annotationen, verschiedenen Öffentlichkeitsgraden (öffentlich / halböffentlich / privat und dem Rollenmangement) getätigter Annotationen sowie deren Flüchtigkeit und Persistenz zur Diskussion. Im Rahmen des zweiten Workshops wurde konkretisiert, welche Kriterien und Ansatzpunkte für die Entwicklung von technisch-infrastrukturellen Lösungen relevant sind, um letztlich dem selbstgesetzten Ziel, Annotationsprozesse und Annotationsergebnisse zusammenzuführen, ein wenig näher zu kommen.
Kurzum: Wir sind mit der Gesamtsituation unzufrieden.
Der Fokus unseres Beitrags liegt auf den Formen und Funktionen von Annotationen, aus denen wir schließlich Anforderungen für Annotationswerkzeuge und digitale Infrastrukturen ableiten möchten. Er richtet sich damit disziplinübergreifend an Geisteswissenschaftlerinnen und -wissenschaftler, die annotieren und hierzu computerbasierte Werkzeuge einsetzen oder entwickeln. Er richtet sich zudem an Gedächtnisinstitutionen, die zu annotierende „Quellen“ liefern (z.B. Archive, Bibliotheken und Museen) oder Schnittstellen anbieten, die den Annotationsprozess ermöglichen.
2. Formen und Funktionen von Annotationen
Die Diskussionen in den Workshops führten zu hilfreichen Differenzierungen hinsichtlich der Gegenstände der Annotation und verschiedener Typen von Annotationen (2.1). Außerdem konnten mögliche Funktionen von Annotationen als Grundlage einer Bedarfsbeschreibung auf diesem Gebiet bestimmt werden. Im Hinblick auf Funktionen bzw. Verwendungsmöglichkeiten und Ziele von Annotationen lassen sich zwei Hauptperspektiven einnehmen, die in den Diskussionen im Rahmen der DARIAH Round Table-Workshops herausgearbeitet worden: einerseits die Betrachtung von Annotationen als Ergebnisse von Forschungs- und Erschließungsprozessen, als Produkte, die dokumentiert, publiziert und vernetzt werden sollen (2.2), andererseits die Sicht auf Annotationen als Zwischenschritt in Forschungsprozessen, auf dem weitere Verarbeitungsverfahren (Analysen, Visualisierungen usw.) aufsetzen (2.3). Die Möglichkeit der Kombination dieser beiden Aspekte und die mögliche Einbindung von Annotationen in iterative Prozesse, in denen Speicherung, Publikation und Verarbeitungsverfahren mehrfach aufeinander folgen, sind ebenfalls zu berücksichtigen.
2.1 Annotationstypen und Annotationsgegenstände
Ursprünglich ist eine Annotation eine Randbemerkung in Form eines Kommentars oder einer Erläuterung zu einem Text oder Bild. Je nach Anwendungsgebiet und zugrundeliegendem Forschungsprozess kann diese Form der Annotation in Beschreibungsgrad und Nutzungsmöglichkeit variieren. Die Digitalisierung führte im Vergleich zum vordigitalen Annotieren zu einem grundlegenden Paradigmenwechsel. Digitale Annotationen sind im Vergleich zu den ursprünglich analogen Annotationen multimediale Verweise wie Mark-ups, Lesezeichen, Tags, Wörter, Bewertungen, Transkriptionen, Fußnoten und Symbole, die verschiedenen Annotationsgegenständen wie Texten, Bildern, Audio-, Videodateien, 3D-Objekten, Karten, Datenbanken und Webseiten hinzugefügt werden können. Sie gehen somit über rein deskriptive Metadaten hinaus und können im Einzelfall als Mikro-Publikationen eines Autors oder einer Autorin verstanden werden.
Digitale Annotationen verfolgen den Zweck, insbesondere den Diskurs und die Kollaboration im Internet zu optimieren. Allerdings müssen fachwissenschaftliche Annotationen deutlich von Annotationsformen, wie sie in sozialen Netzwerken und auf Kommunikationsplattformen (z.B. Twitter, YouTube, Flickr) Verwendung finden, unterschieden werden. Darüber hinaus dienen semantische Annotationen, wie sie im Kontext von Semantic Web Technologien zum Einsatz kommen, als Lösungsansatz für die Gewährleistung von Interoperabilität sowie einer eindeutigen Referenzierbarkeit. Aufgrund der steigenden Anzahl von Sammlungen und Datenmengen werden zudem zunehmend automatische Annotationstechniken entwickelt und eingesetzt. Automatische und manuelle Annotationsprozesse können sich hierbei durchaus ergänzen. Desweiteren müssen Annotationen hinsichtlich Standardisierungsgrad, freier Verfügbarkeit, Dauerhaftigkeit und Zitierfähigkeit unterschieden werden.
Welche Gegenstände werden annotiert? Wie schon kurz angerissen, denkt man vom Analogen her kommend als erstes an die eigenen Bücher, an die vielen Unterstreichungen und Notizen am Rand, um die Textstruktur zu begreifen, relevante Passagen hervorzuheben oder eigene Ideen zu fixieren. Ebenso verhält es sich mit den verschiedenen Sorten und Ausprägungen digitaler Texte. Doch nicht nur digital vorliegende schriftsprachliche Texte, sondern auch digitale Bilder (z.B. schriftsprachlicher Text als Bilddigitalisat, digitale Reproduktion eines Gemäldes, digitale bzw. digitalisierte Fotografie eines dreidimensionalen Objekts, genuin digitales Bild etc.), Bewegtbilder (Frame, Sequenz), aufgezeichnete Bewegungsmuster (Tanz / Choreographie), 3D-Modelle, Noten, Audio, Karten etc. können annotiert werden – ja sogar die „Realität“ (augmented reality). Es scheint daher, als könne jeder Gegenstand zum Objekt einer Annotation werden – seine Transformation ins Digitale vorausgesetzt. Was aktuell (noch) nicht digital annotiert wird, deutet auf künftige Herausforderungen und offene Potentiale dieses wachsenden Bereichs.
Ein Bewegtbildframe kann schriftsprachlich annotiert werden, umgekehrt kann aber auch ein Videoausschnitt zur Annotation eines Textes herangezogen werden. Jeder Annotationsgegenstand kann also als Bestandteil einer Annotation zu einem anderen Annotationsgegenstand fungieren. Digitale Annotationen sind im Prinzip inter- und crossmedial umsetzbar. Es lassen sich schriftliche bzw. sprachliche von graphischen Annotationen und zeitliche von topologisch-geografischen Annotationen unterscheiden. Da zudem Annotationen zu Annotationen möglich sind (Meta-Annotationen), entsteht ein rhizomares Geflecht aus heterogenem Material, das wechselseitig aufeinander verweist. Ein solches Geflecht ist einerseits Produkt von Annotationsprozessen (Annotationen als Ergebnis), das nach einer dauerhaften Zugänglichkeit verlangt (Repositorien, LZA etc.) sowie nach einer Möglichkeit, einzelne Fragmente des Annotationsgegenstandes persistent zu adressieren; andererseits fungieren Annotationen als Ausgangspunkt für weitere Analysen (Annotationen als Intermedium).
2.2 Annotationen als Ergebnis bzw. Produkt
Annotationen können als Ergebnisse von Forschungsprozessen bzw. als Produkte von wissenschaftlicher Arbeit angesehen werden. Das ist eine von zwei Hauptperspektiven auf Annotationen, aus der Bedarf bzw. Anforderungen an Infrastrukturen formuliert wurde. Annotationen sind als Produkte vor allem darauf ausgerichtet, als inhaltliche Anreicherungen der annotierten Gegenstände dokumentiert und dauerhaft gespeichert zu werden – mit Anknüpfung an die jeweilige(n) Stelle(n) der Gegenstände, auf die sie bezogen sind. Dies kann zum einen zur Dokumentation des individuellen oder kollaborativen wissenschaftlichen Arbeitsprozesses dienen, andererseits aber auch vor allem die inhaltliche Erschließung bzw. Erweiterung der Gegenstände zum Ziel haben. Als Beispiel für die Funktion von Annotationen im Sinne von Ergebnissen/Produkten kann neben der strukturellen und formalen Auszeichnungen von Inhalten die Stellenkommentierung in digitalen Editionen aufgeführt werden.
Über die Speicherung und die Verknüpfung mit dem Gegenstand hinaus besteht dahingehend Bedarf, dass Annotationen als Mikropublikationen umgesetzt und anerkannt werden sollen. Ihre persistente Adressierbarkeit und Zitierbarkeit bzw. feingranulare Referenzierbarkeit sowie ihre Anerkennung als wissenschaftliche Leistungen sind dabei wichtige Aspekte. Infrastrukturelle Voraussetzung dafür ist ein entsprechend feingranulares Rechtemanagement und eine Versionenverwaltung.
Ein weiterer wichtiger Aspekt aus dieser Produkt-Perspektive sind Verknüpfungen – und zwar nicht nur zwischen Annotationen und den ursprünglich annotierten Gegenständen, sondern auch zwischen Annotationen untereinander und zu anderen Gegenständen und Quellen, z.B. Sekundärliteratur. Auf dieser Ebene können einerseits intra- und intertextuelle bzw. inter- und transmediale Kohärenzbezüge explizit gemacht werden, anderseits können – sozusagen metatextuell – wissenschaftliche Diskurse stattfinden und über Annotationen entwickelt werden. Solche als Ergebnisse bzw. Produkte angesehene Annotationen können wiederum als Basis für weiterverarbeitende Prozesse dienen, die im nachfolgenden Abschnitt beschrieben werden.
2.3 Annotationen als Intermedium / Zwischenschritt / Prozess
Betrachtet man Annotationen als Prozess bzw. als Teil von Forschungsprozessen im Sinne eines Zwischenschritts, stehen die folgenden Fragen im Mittelpunkt: Wie können Annotationen weiterverarbeitet oder nachgenutzt werden? Für was sollen die Annotationen als Grundlage dienen? Wie sind Annotationen in Prozesse, Verfahren und Arbeitsabläufe eingebunden? Aus dieser Perspektive sind vor allem Anforderungen an digitale Infrastrukturen im Bereich des kollaborativen Annotierens, der Unterstützung von Standards und iterativen Workflows von Bedeutung.
Einerseits spielen Tools für einzelne Wissenschaftler/innen eine wichtige Rolle, andererseits muss identifiziert werden, wie Annotationsworkflows zwischen Projektpartnern und projektübergreifende Verfahren organisiert werden können. Dies betrifft Versionierungsmöglichkeiten sowie die Voraussetzungen für die Weiterverwendungsmöglichkeiten von Annotationen für Analysen, Visualisierungen und z.B. Machine-Learning-Verfahren, also auch die Integration von manueller und automatisierter Annotation unterschiedlicher Gegenstände.
3. Fazit: Anforderungen an Annotationswerkzeuge und digitale Infrastrukturen
Auf Basis der bislang beschriebenen Formen und Funktionen von Annotationen lassen sich einige allgemeine Anforderungen an Annotationswerkzeuge und digitale Infrastrukturen identifizieren:
– Ein entscheidender Anforderungsbereich ist die Organisation der inhaltlichen Komponenten, also der Annotationsgegenstände und der Annotationsinhalte in einem stabilen System – z.B. durch ein Digital Asset Management System mit Schnittstellen zur Anwendungsprogrammierung (APIs) – als Basis für das Anbinden von Annotationstools.
– Auch der Anforderungsbereich der Beschreibungssprachen ist dabei von Bedeutung, z.B. die Berücksichtigung bestehender Austausch- und Beschreibungsformate wie das Open Data Annotation Model.
– Die Verknüpfbarkeit (auch mit anderen Annotationsgegenständen sowie anderen Annotationsschichten), Importierbarkeit und Exportierbarkeit von Inhalten muss über diese inhaltliche Organisation geregelt werden können. Dies muss z.B. die Möglichkeit umfassen, verschiedene Komponenten zu gruppieren und gemeinsam zu referenzieren – und zwar nicht nur hinsichtlich ganzer Dateien, sondern auch im Hinblick auf einzelne Elemente. In Bezug auf graphische Annotationen wären das z.B. bestimmte Formen und Koordinaten, auf schriftliche Texte bezogen Größen wie Absätze, Paragraphen, Sätze, Wörter usw.
– Eine weitere Anforderung an die Inhalteorganisation besteht darin, verschiedene Annotationsebenen ein- und ausblenden zu können, Annotationen also nach unterschiedlichen Layern zu organisieren.
– Die inhaltliche Organisation ist also auch Voraussetzung für die Organisation von Arbeitsprozessen – auch im Hinblick auf das verteilte, kollaborative Arbeiten. Neben der Versionierung steht hier ein feingranulares Zugriffs- und Rechtemanagement im Mittelpunkt – unter Berücksichtigung der Akteure (z.B. Individuen, Gruppen, angeschlossene Maschinen / Services, Disziplinen, Öffentlichkeit) auf Basis spezifischer Aktionen (z.B. lesen, verändern, versionieren, löschen, veröffentlichen (drucken, exportieren, weiternutzen). Die aufgeführten Punkte stehen in engem Zusammenhang mit der Speicherung von Komponenten und verschiedenen Versionen, die im Workflow entstehen.
– Die langfristige Verfügbarkeit und die feingranulare Referenzierbarkeit stehen damit in engem Zusammenhang und sind Voraussetzung für Transparenz, Nachprüfbarkeit und Qualitätssicherung.
– Urheber- und Zugriffs-Rechtefragen, Lizenzen und Datenschutz wurden ebenfalls mehrfach als Bedarfsaspekte geäußert.
– Nicht zu unterschätzen ist das Thema „Usability“, vereinfacht ausgedrückt die Erlernbarkeit und Bedienbarkeit der Interfaces der Infrastruktur sowie der Werkzeuge, auch um die Einstiegshürde gering zu halten. Angesichts der wachsenenden Vielfalt verschiedener Endgeräte nimmt die Anzeige von Inhalten und der Bedienbarkeit für konzentriertes Arbeiten auch im Wechsel zwischen unterschiedlichen Geräten einen hohen Stellenwert ein.
In diesem Sinne: Annotatoren aller Länder vereinigt euch!
Die Initiatoren dieses Positionspapiers haben eine Mailingliste eingerichtet und freuen sich über weiteren Austausch. Literatur zum Thema Annotationen ist in der Bibliographie Doing Digital Humanities zu finden.
Kommentar schreiben