DH-Kolloquium @BBAW, 7.6.2019 / Gregor Middell: „Das Suchportal Arno Schmidt – Zur digitalen Erschließung der Bargfelder Ausgabe”
Im Rahmen des DH-Kolloquiums an der Berlin-Brandenburgischen Akademie der Wissenschaften möchten wir Sie herzlich zum nächsten Termin am Freitag, den 7. Juni 2019, 17 Uhr s.t. bis 19 Uhr (Konferenzraum 1) einladen.
Gregor Middell (pagina Publikationstechnologien, Tübingen)
„Das Suchportal Arno Schmidt – Zur digitalen Erschließung der Bargfelder Ausgabe”.
Zum 105. Geburtstag ihres Autors veröffentlichte die Arno-Schmidt-Stiftung im Januar dieses Jahres ein web-basiertes Findmittel, mit dem die gesamte Bargfelder Ausgabe der Werke Schmidts online durchsucht werden kann (https://www.arno-schmidt-stiftung.de/eba/). Das Suchportal löst damit die „Bargfelder Ausgabe auf CD-ROM” aus dem Jahr 1998 ab. Wie die CD-ROM-Version erlaubt auch das neue Portal die Volltextrecherche im über 9.900 Seiten umfassenden Bestand und berücksichtigt Schmidts teils unkonventionelle Orthographie. Anders als die Vorgängerversion basiert sie nicht nur auf einem Volltextindex mit absatzweisen Referenzen zu den entsprechenden Seiten der Ausgabe. Neben dem Index für die Recherche im Text stützt sich das Portal bei der Präsentation der Suchergebnisse auf ein automatisch erzeugtes, zeilenweises Referenzsystem zwischen dem Volltext und entsprechenden Ausschnitten („snippets”) digitaler Reproduktionen aller Buchseiten. Das System ermöglicht somit Ergebnisdarstellungen, wie man sie von Google Books kennt und die, wegen der formalen Besonderheiten (Marginalien, mehrspaltiger Text) gerade im Spätwerk Schmidts, die Erschließung desselben erleichtern sollen.
Zur Erzeugung des Referenzsystems zwischen Text (vorliegend im Microsoft-Word-Format) und den digitalen Reproduktionen einzelner Buchseiten dienten neben OCR-Verfahren solche des computergestützten Textvergleichs. Ihr Einsatz sowie die besonderen Herausforderungen bei der Aufbereitung der Eingangsdaten, etwa der Umgang mit OCR-Fehlern oder mit Umstellungen in der Reihenfolge von Volltext und OCR-Ergebnis, bilden neben einer Einführung in die Softwarearchitektur des Portals den Gegenstand des Vortrags.
Die Veranstaltung findet im Konferenzraum 1 der Berlin-Brandenburgischen Akademie der Wissenschaften, Jägerstr. 22/23, 10117 Berlin statt. Da die Teilnehmerzahl begrenzt ist, bitten wir Sie um Anmeldung per E-Mail an: DH-Kolloquium@bbaw.de
Kommentar schreiben