Langzeitarchivierung und Bereitstellung digitaler Verlagsdaten – CERN / data Futures / Merve Verlag

1 Veröffentlicht von José Calvo Tello am

2015 hat der Merve Verlag ein auf mehrere Jahre angelegtes Projekt gestartet, mit dem Ziel, seine Backlist zu digitalisieren und archivieren, und zugleich als agnostischen, wiederverwendbaren Text bzw. Markup bereitzustellen. 2017 wurde ein erster Meilenstein mit der Einführung herunterladbarer ePUB- und PDF-Formate für die Backlist erreicht. 2019 wurde ein Open-Access Testbetrieb mit registrierten AnwenderInnen aufgenommen.

Für die Buchmesse 2020 wurde zusätzlich zur Backlist der gesamte aktuelle Katalog des Merve Verlags in identischer Weise digital neu aufbereitet. Anfang 2021 wird eine Volltextsuche nebst Open-Access-Zugriff für das gesamte Korpus von mehr als 500 Verlagstiteln freigeschaltet.

Die digitale Merve-Edition basiert zum einen auf Invenio – dem am CERN entwickelten und langfristig unterstützten Open-Source-Software-Framework zur Speicherung und Verwaltung großer Datenbestände, mit dem bspw. auch der Online-Speicherdienst Zenodo betrieben wird. Die Bereitstellung der digitalen Merve-Edition erfolgt wiederum über einen IIIF-Service, der zahlreiche aktuelle und zukünftige Browser bzw. eReader unterstützt.

Der auf Nachhaltigkeit zielende Ansatz wird in den kommenden zwölf Monaten um weitere Services erweitert: Falls Drucktitel vergriffen sein sollten, kann 2021 automatisch auf Print-on-Demand Angebote umgestellt werden. Kunden können einzelne Titel oder Aufsätze zu individuellen Kompilationen bündeln und ebenfalls per P-o-D ausdrucken. Zudem werden standardbasierte Anmerkungen zum gesamten Merve-Korpus unterstützt: Individuelle Annotationen, via ORCID authentifiziert, werden automatisch in Zenodo-Datensätze konvertiert und mit einem DOI versehen. So sind sie nachhaltig gespeichert, lassen sich einfach mit anderen teilen oder kombinieren, und bleiben zugleich mit den Merve-Quelltexten verbunden. Auch die Annotationen lassen sich zusammen mit dem Originaltext als P-o-D ausgeben.

Tom Lamberty, Merve-Verleger:

„Das Release zur Buchmesse 2020 ist ein weiterer wichtiger Schritt in unserer langfristigen Digitalisierungsstrategie – die bis ins Jahr 2005 zurückreicht, als wir als erster Verlag in Europa einen funktionsfähigen Handy-Reader angeboten haben. Auf der Buchmesse 2017 konnten wir in Zusammenarbeit mit dem Game Lab der Humboldt Universität Berlin das weltweit erste VR-Lesegerät vorstellen. Und heute sind wir endlich soweit, unsere Investitionen in eine integrierte, interoperable und zukunftssichere digitale Infrastruktur für alle zukünftigen Verlags-Digitalisate mit neuen Suchdiensten und innovativen Distributionskanälen zu kombinieren.“

José Gonzalez, Leiter der Repository-Technologien beim CERN:

„Es ist bemerkenswert, dass der Verlagssektor so schnell dazu übergegangen ist, die für und von den Naturwissenschaften entwickelten innovativen Technologien zu nutzen und umfangreiche Datenbestände für Open-Access Präsentationen zu erschließen. Wir erwarten, dass die bevorstehenden Entwicklungen im Bereich der Annotation mit InvenioRDM – das die automatisierte Erstellung wiederverwendbarer Zenodo-Datensätze erlaubt – die Nutzung von Primärquellen auch in vielen anderen Bereichen revolutionieren werden“.

Peter Cornwell, Direktor der Data Futures GmbH:

„Die Kombination aus

  • der Darstellung digitaler Objekte via IIIF,
  • ihrer Speicherung in korpusspezifischen Invenio-Repositorien und
  • ihrer Annotation konform zum WADM (Web Annotation Data Model)

in einer integrierten Forschungsplattform schafft zum ersten Mal die Möglichkeit, langfristige Zugriffsmöglichkeiten und nachhaltige Archivierung digitaler Objekte effektiv zu automatisieren. Leider müssen wir im Vergleich dazu immer wieder feststellen, dass diese kritischen Komponenten bei einer Vielzahl von Digitalisierungsprojekten (nicht nur) im Forschungsbereich in aller Regel zu spät Beachtung finden und nachträglich bereitgestellte Investitionen – wenn es sie überhaupt gibt – normalerweise nicht ausreichen.“

Zu diesem Thema wird es am kommenden Freitag von 15-16 Uhr CEST ein Webinar geben, der Registrierungslink findet sich hier: https://www.data-futures.org/pages/events

Kommentar schreiben