{"id":14587,"date":"2020-10-29T10:54:51","date_gmt":"2020-10-29T09:54:51","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=14587"},"modified":"2020-11-13T09:38:56","modified_gmt":"2020-11-13T08:38:56","slug":"virtuelles-dh-kolloquium-an-der-bbaw-13-11-2020-annelen-brunner-redewiedergabe-korpusressourcen-automatische-erkenner","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=14587","title":{"rendered":"Virtuelles DH-Kolloquium an der BBAW, 13.11.2020, Annelen Brunner: &#8222;Redewiedergabe \u2013 Korpusressourcen &amp; Automatische Erkenner&#8220;"},"content":{"rendered":"\n<p>Am <strong>13. November 2020<\/strong>, <strong>von 17 Uhr bis ca. 19 Uhr<\/strong>, findet erneut das virtuelle DH-Kolloquium der BBAW statt, bei dem Referentin Dr. Annelen Brunner (Leibniz-Institut f\u00fcr Deutsche Sprache Mannheim) die durch das Projekt \u201eRedewiedergabe&#8220; zur Nachnutzung bereitgestellten Korpusressourcen und automatischen Erkenner f\u00fcr Redewiedergabe vorstellen wird.<\/p>\n\n\n\n<p>Der Vortrag, dessen Ank\u00fcndigung untenstehend zu finden ist, wird vorab aufgezeichnet und rechtzeitig vor Beginn des Kolloquiums bereitgestellt. Der Link zum Vortrag wird parallel auf Twitter (<a href=\"https:\/\/twitter.com\/DHBBAW\">@DHBBAW<\/a>) sowie im Channel \u201eberlin_dhberlin\u201c auf der Plattform <em>discord <\/em>(\u21d2 Einladungslink:&nbsp;<a href=\"https:\/\/discord.gg\/sw4D5NN\">https:\/\/discord.gg\/sw4D5NN<\/a>) gepostet. <\/p>\n\n\n\n<p>Zur Kolloquiumszeit startet auf der Plattform <em>discord <\/em>die Diskussion, zu der wir hiermit alle Interessierten sehr herzlich einladen m\u00f6chten. Zuh\u00f6rerinnen und Zuh\u00f6rer k\u00f6nnen ihre Fragen au\u00dferdem per Mail an dh-kolloquium@bbaw.de senden. Diese werden von den OrganisatorInnen des Kolloquiums ausgew\u00e4hlt und dann (ggf. verk\u00fcrzt) \u00fcber <em>discord<\/em> an die Referentin weitergegeben. <\/p>\n\n\n\n<!--more-->\n\n\n\n<p><strong>Redewiedergabe \u2013 Korpusressourcen &amp; Automatische Erkenner<br \/><\/strong>Dr. Annelen Brunner (IDS Mannheim)<br \/>13.11.2020, 17\u201319 Uhr (virtuell)<br \/>Zum Vortrag: <a href=\"https:\/\/vimeo.com\/477623161\">https:\/\/vimeo.com\/477623161<\/a><\/p>\n\n\n\n<p>Das 2020 abgeschlossene DFG-Projekt \u201eRedewiedergabe\u201c (<a href=\"http:\/\/www.redewiedergabe.de\">www.redewiedergabe.de<\/a>; <a href=\"https:\/\/github.com\/redewiedergabe\">github.com\/redewiedergabe<\/a>) besch\u00e4ftigte sich mit der empirischen Erforschung von Formen der Wiedergabe von Rede und Gedanken im Deutschen. Im Fokus standen die Typen direkte (<em>Er sagte: <u>\u201eIch habe Hunger.\u201c<\/u><\/em>), indirekte (<em>Er sagte, <u>er habe Hunger.<\/u><\/em>), freie indirekte (<em>Er war ratlos. <u>Wo sollte er jetzt nur etwas zu essen finden?<\/u><\/em>) und erz\u00e4hlte Wiedergabe (<em><u>Sie sprachen \u00fcber das Mittagessen.<\/u><\/em>). Dieser Vortrag stellt die Ressourcen vor, die w\u00e4hrend der Projektlaufzeit entstanden sind und der Forschungsgemeinschaft frei zur Verf\u00fcgung gestellt werden.<\/p>\n\n\n\n<p>Dies sind zum einen aufwendig manuell nach Redewiedergabeformen annotierte Sprachdaten (Zeitraum: 1840-1920; fiktionale und nicht-fiktionale Texte). Das balancierte Kernkorpus umfasst 490.000 Tokens, zus\u00e4tzlich stehen ca. 3 Mio. Tokens an annotiertem Material mit z.T. vereinfachtem Annotationssystem zur Verf\u00fcgung.<\/p>\n\n\n\n<p>Zum anderen wurden im Projekt auf DeepLearning basierende automatischer Erkenner f\u00fcr Redewiedergabe entwickelt, die quantitative Studien an gro\u00dfen Textmengen erm\u00f6glichen. Im Vortrag wird auch ein Anwendungsszenario dieser Werkzeuge vorgestellt.<\/p>\n\n\n\n<p>Wir hoffen, Interesse an diesen neuartigen Ressourcen zu wecken, die sowohl f\u00fcr linguistische und literaturwissenschaftliche als auch computerlinguistische Projekte n\u00fctzlich sein k\u00f6nnen.<\/p>\n\n\n\n<p><strong>Publikationen:<\/strong><\/p>\n<p>Annelen Brunner, Stefan Engelberg, Fotis Jannidis, Ngoc Duyen Tanja Tu, Lukas Weimer (2020): <a href=\"http:\/\/www.lrec-conf.org\/proceedings\/lrec2020\/pdf\/2020.lrec-1.100.pdf\">Corpus REDEWIEDERGABE<\/a>, Proceedings of the 12th Language Resources and Evaluation Conference, Marseille, S. 796-805.<\/p>\n<p>Annelen Brunner, Ngoc Duyen Tanja Tu, Lukas Weimer, Fotis Jannidis (2020): <a href=\"http:\/\/ceur-ws.org\/Vol-2624\/paper5.pdf\">To BERT or not to BERT \u2013 Comparing Contextual Embeddings in a Deep Learning Architecture for the Automatic Recognition of four Types of Speech, Thought and Writing Representation<\/a>, Proceedings of the 5th Swiss Text Analytics Conference (SwissText) &amp; 16th Conference on Natural Language Processing (KONVENS), Zurich, Switzerland, June 23-25, 2020.<\/p>\n\n\n","protected":false},"excerpt":{"rendered":"<p>Am 13. November 2020, von 17 Uhr bis ca. 19 Uhr, findet erneut das virtuelle DH-Kolloquium der BBAW statt, bei dem Referentin Dr. Annelen Brunner (Leibniz-Institut f\u00fcr Deutsche Sprache Mannheim) die durch das Projekt \u201eRedewiedergabe&#8220; zur Nachnutzung bereitgestellten Korpusressourcen und automatischen Erkenner f\u00fcr Redewiedergabe vorstellen wird. Der Vortrag, dessen Ank\u00fcndigung untenstehend zu finden ist, wird [&hellip;]<\/p>\n","protected":false},"author":218,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,161,4,657],"tags":[759,412,1152,736,819,485,329,539,231],"class_list":["post-14587","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-kolloquium","category-veranstaltungen","category-vortrag","tag-bbaw","tag-clarin-d","tag-deep-learning","tag-dh-kolloquium","tag-digitale-literaturwissenschaften","tag-korpusaufbau","tag-korpuslinguistik","tag-machine-learning","tag-telota"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14587","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/218"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=14587"}],"version-history":[{"count":11,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14587\/revisions"}],"predecessor-version":[{"id":14663,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14587\/revisions\/14663"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=14587"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=14587"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=14587"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}