Korpusbildung-Workshop der AG Zeitungen und Zeitschriften

1 Veröffentlicht von Nanette Rißler-Pipka am

Die DHd-AG Zeitungen & Zeitschriften (https://dhd-ag-zz.github.io/) bietet am 11. und 12. November 2021 jeweils von 9:00-13:00 Uhr einen virtuellen Workshop an, um anhand digitaler Zeitungs- und Zeitschriftenbestände zu zeigen, wie die für viele Forschende notwendige, individuelle Korpusbildung in Zeitungsportalen selbst sowie mittels NLP-Methoden unterstützt werden kann. 

Geisteswissenschaftliche Forschung basiert häufig auf themenspezifischen Forschungsfragen, weshalb die Korpusbildung einen wesentlichen Aspekt in der Arbeit mit digitalen Quellen einnimmt. Solche Korpora müssen jedoch nicht selten in zeitaufwändigen und komplexen Prozessen erstellt werden, weil Suchstrategien nicht ausreichen oder weil fehlende Layout- Segmentierung den Zugriff erschwert. Insbesondere bei retro-digitalisierten Zeitungen hängt die Korpusbildung stark von der Qualität der Digitalisate (OCR und Artikelsegmentierung) ab. 

Im Workshop “Korpusbildung” werden wir deshalb auf Methoden und Tools eingehen, die eine Korpusbildung erleichtern. 

Am 11. November geben wir

  • einen allgemeinen Einblick in das Zeitungsportal der Deutschen Digitalen Bibliothek (DDB)
  • einen Überblick zum Thema Korpusbildung
  • ein Hands-on zur Korpusbildung mit der NewsEye-Plattform und den dort vorhandenen 1,5 Millionen Zeitungsseiten 

Am 12. November konzentrieren wir uns auf NLP-Methoden, die die Korpusbildung mit aus den Zeitungsportalen extrahierten Daten unterstützen. Mit Hilfe von Jupyter Notebooks, die via myBinder eine interaktive Arbeitsumgebung zulassen, werden gemeinsam verschiedene Methoden ausprobiert.  Hierbei setzen wir uns mit folgenden Fragen auseinander: 

  • Wie kann die Korpusbildung unterstützt werden, wenn Suchbegriffe mehrdeutig sind?
  • Wie kann ein Korpus mit Hilfe von NLP-Methoden auf ein bestimmtes Genre oder einen bestimmten Diskurs eingegrenzt werden?

Programmierkenntnisse sind nicht erforderlich, ein grundsätzliches Interesse daran jedoch hilfreich. Die Teilnehmerzahl ist auf 20 Personen limitiert

Der Workshop wird geleitet von: Sarah Oberbichler und Eva Pfanzelter (beide Institut für Zeitgeschichte, Universität Innsbruck).

Anmeldungen bitte per e-mail an die Convenor der AG Nanette Rißler-Pipka (rissler-pipka@sub.uni-goettingen.de) und Torsten Roeder (dh@torstenroeder.de) bis spätestens zum 20. Oktober 2021. Die Plätze werden in der Reihenfolge des Anmeldungseingangs vergeben. Die Zugangsdaten zum virtuellen Raum sowie weitere praktische Informationen werden kurz vor dem Workshop an die Teilnehmer*innen verteilt.

Ein Kommentar Kommentar schreiben
  • no image

    November: nationale und internationale Veranstaltungen im Bereich Open Science – SLUB Open Science Lab

    Antworten

    […] Workshop der AG Zeitungen und ZeitschriftenDatum: 11. bis 12.11. 2021 – jeweils von 9:00-13:00 UhrOrt: virtuell […]

Kommentar schreiben