{"id":16557,"date":"2021-09-23T17:57:59","date_gmt":"2021-09-23T15:57:59","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=16557"},"modified":"2021-09-30T11:33:29","modified_gmt":"2021-09-30T09:33:29","slug":"korpusbildung-workshop-der-ag-zeitungen-und-zeitschriften","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=16557","title":{"rendered":"Korpusbildung-Workshop der AG Zeitungen und Zeitschriften"},"content":{"rendered":"\n<p>Die DHd-AG Zeitungen &amp; Zeitschriften (<a href=\"https:\/\/dhd-ag-zz.github.io\/\"><code>https:\/\/dhd-ag-zz.github.io\/<\/code><\/a>) bietet am <strong>11. und 12. November 2021 jeweils von 9:00-13:00 Uhr<\/strong> einen virtuellen Workshop an, um anhand digitaler Zeitungs- und Zeitschriftenbest\u00e4nde zu zeigen, wie die f\u00fcr viele Forschende notwendige, individuelle Korpusbildung in Zeitungsportalen selbst sowie mittels NLP-Methoden unterst\u00fctzt werden kann.\u00a0<\/p>\n<p>Geisteswissenschaftliche Forschung basiert h\u00e4ufig auf themenspezifischen Forschungsfragen, weshalb die Korpusbildung einen wesentlichen Aspekt in der Arbeit mit digitalen Quellen einnimmt. Solche Korpora m\u00fcssen jedoch nicht selten in zeitaufw\u00e4ndigen und komplexen Prozessen erstellt werden, weil Suchstrategien nicht ausreichen oder weil fehlende Layout- Segmentierung den Zugriff erschwert. Insbesondere bei retro-digitalisierten Zeitungen h\u00e4ngt die Korpusbildung stark von der Qualit\u00e4t der Digitalisate (OCR und Artikelsegmentierung) ab.\u00a0<\/p>\n<p>Im Workshop \u201cKorpusbildung\u201d werden wir deshalb auf Methoden und Tools eingehen, die eine Korpusbildung erleichtern.\u00a0<\/p>\n<p><strong>Am 11. November geben wir<\/strong>:\u00a0<\/p>\n<ul>\n<li>einen allgemeinen Einblick in das Zeitungsportal der Deutschen Digitalen Bibliothek (DDB)<\/li>\n<li>einen \u00dcberblick zum Thema Korpusbildung<\/li>\n<li>ein Hands-on zur Korpusbildung mit der <em>NewsEye<\/em>-Plattform und den dort vorhandenen 1,5 Millionen Zeitungsseiten\u00a0<\/li>\n<\/ul>\n<p><strong>Am 12. November konzentrieren<\/strong> wir uns auf NLP-Methoden, die die Korpusbildung mit aus den Zeitungsportalen extrahierten Daten unterst\u00fctzen. Mit Hilfe von Jupyter Notebooks, die via <em>myBinder <\/em>eine interaktive Arbeitsumgebung zulassen, werden gemeinsam verschiedene Methoden ausprobiert.\u00a0 Hierbei setzen wir uns mit folgenden Fragen auseinander:\u00a0<\/p>\n<ul>\n<li>Wie kann die Korpusbildung unterst\u00fctzt werden, wenn Suchbegriffe mehrdeutig sind?<\/li>\n<li>Wie kann ein Korpus mit Hilfe von NLP-Methoden auf ein bestimmtes Genre oder einen bestimmten Diskurs eingegrenzt werden?<\/li>\n<\/ul>\n<p>Programmierkenntnisse sind nicht erforderlich, ein grunds\u00e4tzliches Interesse daran jedoch hilfreich. <strong>Die Teilnehmerzahl ist auf 20 Personen limitiert<\/strong>.\u00a0<\/p>\n<p>Der Workshop wird geleitet von: Sarah Oberbichler und Eva Pfanzelter (beide Institut f\u00fcr Zeitgeschichte, Universit\u00e4t Innsbruck).<\/p>\n<p><strong>Anmeldungen<\/strong> bitte per e-mail an die Convenor der AG Nanette Ri\u00dfler-Pipka (<a href=\"mailto:rissler-pipka@sub.uni-goettingen.de\">rissler-pipka@sub.uni-goettingen.de<\/a>) und Torsten Roeder (<a href=\"mailto:dh@torstenroeder.de\">dh@torstenroeder.de<\/a>) <strong>bis sp\u00e4testens zum 20. Oktober 2021<\/strong>. Die Pl\u00e4tze werden in der Reihenfolge des Anmeldungseingangs vergeben. Die Zugangsdaten zum virtuellen Raum sowie weitere praktische Informationen werden kurz vor dem Workshop an die Teilnehmer*innen verteilt.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die DHd-AG Zeitungen &amp; Zeitschriften (https:\/\/dhd-ag-zz.github.io\/) bietet am 11. und 12. November 2021 jeweils von 9:00-13:00 Uhr einen virtuellen Workshop an, um anhand digitaler Zeitungs- und Zeitschriftenbest\u00e4nde zu zeigen, wie die f\u00fcr viele Forschende notwendige, individuelle Korpusbildung in Zeitungsportalen selbst sowie mittels NLP-Methoden unterst\u00fctzt werden kann.\u00a0 Geisteswissenschaftliche Forschung basiert h\u00e4ufig auf themenspezifischen Forschungsfragen, weshalb die [&hellip;]<\/p>\n","protected":false},"author":176,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,1123,4,1163],"tags":[1174,485,98],"class_list":["post-16557","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-call","category-veranstaltungen","category-webinar","tag-ag-zeitungen-zeitschriften","tag-korpusaufbau","tag-workshop"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/16557","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/176"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=16557"}],"version-history":[{"count":7,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/16557\/revisions"}],"predecessor-version":[{"id":16592,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/16557\/revisions\/16592"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=16557"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=16557"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=16557"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}