{"id":13737,"date":"2020-06-02T10:10:00","date_gmt":"2020-06-02T08:10:00","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=13737"},"modified":"2020-06-01T15:31:05","modified_gmt":"2020-06-01T13:31:05","slug":"maschinelles-lernen-als-interpretationsgrundlage-ein-erfahrungsbericht-zur-dhd-2020","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=13737","title":{"rendered":"Maschinelles Lernen als Interpretationsgrundlage!? &#8211; Ein Erfahrungsbericht zur DHd 2020"},"content":{"rendered":"\n<p>Vom 03. bis 06. M\u00e4rz 2020 habe ich an der DHd 2020 in Paderborn teilgenommen. Im Folgenden m\u00f6chte ich einen thematischen Schwerpunkt n\u00e4her beleuchten, der mich als Teilnehmer besonders interessiert hat.<\/p>\n<p>Das Thema, an dem ich auch pers\u00f6nlich forsche und das ich daher auf der diesj\u00e4hrigen DHd besonders gesucht und verfolgt habe, ist die Frage, wie und inwieweit Maschinelles Lernen (ML) genutzt werden kann, um geisteswissenschaftliche (und insbesondere literaturwissenschaftliche) Fragestellungen zu beantworten (oder zumindest neue Einsichten zu erzeugen).<\/p>\n<p>Maschinelles Lernen bezeichnet eine Methode, bei der mittels statistischer Algorithmen und Daten Modelle erzeugt werden, die aus den gesehenen Daten (statistische) Verallgemeinerungen ziehen und somit auf neue und vorher ungesehene Daten angewendet werden k\u00f6nnen. Die F\u00fclle an vorhandenen Algorithmen und Verfahren ist gro\u00df; eine ML-Familie ist unter dem Namen \u201cDeep Learning\u201d bekannt geworden und bedient sich vor allem K\u00fcnstlicher Neuronaler Netze. Diese Netze waren, auch unter Verwendung von immer st\u00e4rker werdenden Rechnerresourcen, in bestimmten Gebieten wie Automatische Bilderkennung oder Automatische Spracherkennung, so erfolgreich, dass sie bald zugleich f\u00fcr andere Gebiete im gro\u00dfen Stil eingesetzt wurden; darunter f\u00fcr Textverarbeitung.<\/p>\n<p>Maschinelles Lernen und Deep Learning (DL) nehmen in den DH eine interessante Rolle ein, da sie f\u00fcr einige Bereiche sehr gewinnbringend eingesetzt werden k\u00f6nnen (siehe OCR etc.) und f\u00fcr andere Bereiche auf eher gr\u00f6\u00dfere H\u00fcrden sto\u00dfen. Einer dieser Bereiche, die Nutzbarmachung von ML f\u00fcr die Interpretation von literaturwissenschaftlichen Fragestellungen, fand sich auch auf der diesj\u00e4hrigen DHd. Ein kurzer Blick zur\u00fcck: Die DHd 2019 in Mainz\/Frankfurt am Main beherbergte ein Panel mit dem Titel \u201cDeep Learning als Herausforderung f\u00fcr die digitale Literaturwissenschaft\u201d. Auf der diesj\u00e4hrigen DHd konnte ein Panel mit dem Titel \u201cMaschinelles Lernen in den Geisteswissenschaften\u201d besucht werden.<a class=\"sdfootnoteanc\" href=\"#sdfootnote1sym\" name=\"sdfootnote1anc\"><sup>1<\/sup><\/a> Das Auftreten dieser Themen in aufeinanderfolgenden Jahren legt den Schluss nahe, dass das Thema Maschinelles Lernen in den deutschsprachigen Digital Humanities immer mehr an Fahrt aufnimmt.<\/p>\n<p>Das diesj\u00e4hrige Panel bestand aus verschiedenen Aspekten, die, neben einem allgemeinen Einblick dazu, was ML eigentlich ist, zusammengefasst werden k\u00f6nnen mit: 1. Vorhandene Verwendung von ML in den DH, 2. Nutzen von ML und 3. epistemologische Herausforderungen bei der Anwendung von ML. Insbesondere wurde daf\u00fcr pl\u00e4diert, sich zu trauen, Maschinelles Lernen produktiv in die eigene Forschung einzubauen.<\/p>\n<p>Zu der Frage danach, was ML epistemologisch bedeutet, passt die Einf\u00fchrung einer Arbeitsgruppe auf der diesj\u00e4hrigen DHd mit dem Ziel, Theorien in den DH zu beleuchten und der Frage nachzugehen, welche Theoriebegriffe die DH \u00fcberhaupt bereitstellen.<a class=\"sdfootnoteanc\" href=\"#sdfootnote2sym\" name=\"sdfootnote2anc\"><sup>2<\/sup><\/a> Auch der Einsatz von ML in den DH kann meiner Ansicht nach von solchen Bestrebungen profitieren, da klarer wird, was f\u00fcr Erkenntnisgewinne durch die Anwendung von ML \u00fcberhaupt grunds\u00e4tzlich m\u00f6glich sind.<\/p>\n<p>Ein weiterer wichtiger Aspekt, der durch Wortmeldung aus dem Publikum eingebracht wurde, war die Frage danach, inwieweit die DH dazu beitragen k\u00f6nnen, Biases, also Verzerrungen, im Maschinellen Lernen und insbesondere in Word Embeddings, also numerischen Darstellungen von W\u00f6rtern, zu untersuchen. Das Thema \u201cBias in ML und DL\u201d ist ein gro\u00dfes Thema, das momentan von vielen verschiedenen Forschungsfeldern bespielt wird. Es scheint mir offensichtlich, dass die DH mit ihrem inbegriffenen geisteswissenschaftlichen Bezug hier wichtige Beitr\u00e4ge leisten k\u00f6nnen. Der andere Aspekt, der eher inwendig gerichtet ist und f\u00fcr den ich hier gerne werben m\u00f6chte, ist der bereits angesprochene Aspekt der Nutzbarmachung von ML-Methoden, um Erkenntnisse zu geisteswissenschaftlichen Fragestellungen zu gewinnen.<\/p>\n<p>Ein wichtiger Teil davon ist die Frage nach der Operationalisierung von literaturwissenschaftlichen Ph\u00e4nomenen, d.h. komplexe Ph\u00e4nomene in Teilph\u00e4nomene herunterzubrechen um sie z.B. mit Computerprogrammen modellieren und untersuchen zu k\u00f6nnen. Hierzu gab es verschiedene Workshops, an denen ich teilweise mitgewirkt habe: Zum einen ein \u201cHackatorial\u201d, das der Frage nachging, wie die Ergebnisse Maschinellen Lernens genutzt werden k\u00f6nnen, um neue Fragestellungen zu entwickeln und neue Einsichten zu gewinnen, z.B. \u00fcber gezielte Fehleranalyse und Auswahl von geeigneten Features. Hierbei lag der Fokus auf dem Erkennen von Personen-, Organisations- und Ortsreferenzen.<a class=\"sdfootnoteanc\" href=\"#sdfootnote3sym\" name=\"sdfootnote3anc\"><sup>3<\/sup><\/a> Ein weiterer Workshop behandelte die gezielte Operationalisierung von komplexen literaturwissenschaftlichen Ph\u00e4nomenen. Hierbei wurden Texte annotiert, was zugleich erlaubte, interessante Einzelf\u00e4lle ausfindig zu machen, etwa bei der Frage von Textklassifizierung oder Erz\u00e4hlebenenerkennung. Maschinelles Lernen kann anschlie\u00dfend auf die erstellten Daten angewendet werden, um zu ermitteln, wo Modelle unvorhergesehene Entscheidungen treffen. Diese Entscheidungen k\u00f6nnen ein Ausl\u00f6ser daf\u00fcr sein, sich die entsprechenden Textstellen genauer anzuschauen und eventuell Aspekte in den Texten zu entdecken, die sonst \u00fcbersehen worden w\u00e4ren.<a class=\"sdfootnoteanc\" href=\"#sdfootnote4sym\" name=\"sdfootnote4anc\"><sup>4<\/sup><\/a><\/p>\n<p>Die finale Keynote am Freitag von Alan Liu besch\u00e4ftigte sich ebenfalls ganz konkret mit dem Thema und trug den Titel \u201cHumans in the Loop: Humanities Hermeneutics and Machine Learning\u201d. Liu schl\u00e4gt ein festgelegtes Protokoll vor, nach dem verschiedene Ebenen des Lernens von ML durchlaufen werden k\u00f6nnen und macht dies am Beispiel von Topic Modeling deutlich. Geisteswissenschaftliche Herangehensweisen und Erkenntnisse aus den speziellen Gegebenheiten des ML beeinflussen sich hier gegenseitig.<\/p>\n<p>Was also bleibt nach dieser DHd an neuen Eindr\u00fccken zum Thema \u201cML in den DH\u201d? Ich denke, es l\u00e4sst sich auf zwei wesentliche Aspekte zusammen fassen: das Interesse an der Nutzbarmachung von ML zum besseren und neuen Verst\u00e4ndnis der geisteswissenschaftlichen Gegenst\u00e4nde w\u00e4chst immer weiter und gleichzeitig ist der Weg noch lang zu einer routinierten Integration von ML in die DH-Alltagspraxis.<\/p>\n<div id=\"sdfootnote1\">\n<p class=\"sdfootnote\"><a class=\"sdfootnotesym\" href=\"#sdfootnote1anc\" name=\"sdfootnote1sym\">1 <\/a>Panel \u201cMaschinelles Lernen in den Geisteswissenschaften\u201d, Donnerstag, 05.03.2020, 9:00-10:30, Tobias Hodel, Nasrin Saef, Christof Sch\u00f6ch, Ulrike Henny-Krahmer<\/p>\n<\/div>\n<div id=\"sdfootnote2\">\n<p class=\"sdfootnote\"><a class=\"sdfootnotesym\" href=\"#sdfootnote2anc\" name=\"sdfootnote2sym\">2 <\/a><dfn>Link zum Blog der AG: <a href=\"https:\/\/dhtheorien.hypotheses.org\">https:\/\/dhtheorien.hypotheses.org<\/a><\/dfn><\/p>\n<\/div>\n<div id=\"sdfootnote3\">\n<p class=\"sdfootnote\"><a class=\"sdfootnotesym\" href=\"#sdfootnote3anc\" name=\"sdfootnote3sym\">3 <\/a>Workshop \u201cMaschinelles Lernen lernen: Ein CRETA-Hackatorial zur reflektierten automatischen Textanalyse\u201d, Dienstag, 03.03.2020, 9:00-12:30, Gerhard Kremer, Kerstin Jung<\/p>\n<\/div>\n<div id=\"sdfootnote4\">\n<p class=\"sdfootnote\"><a class=\"sdfootnotesym\" href=\"#sdfootnote4anc\" name=\"sdfootnote4sym\">4 <\/a>Workshop \u201cVom Ph\u00e4nomen zur Analyse \u2013 ein CRETA-Workshop zur reflektierten Operationalisierung in den DH\u201d, Dienstag, 03.03.2020, 13:30-17:00, Nora Ketschik, Benjamin Krautter, Sandra Murr, Janis Pagel, Nils Reiter<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Vom 03. bis 06. M\u00e4rz 2020 habe ich an der DHd 2020 in Paderborn teilgenommen. Im Folgenden m\u00f6chte ich einen thematischen Schwerpunkt n\u00e4her beleuchten, der mich als Teilnehmer besonders interessiert hat. Das Thema, an dem ich auch pers\u00f6nlich forsche und das ich daher auf der diesj\u00e4hrigen DHd besonders gesucht und verfolgt habe, ist die Frage, [&hellip;]<\/p>\n","protected":false},"author":244,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,103,534,4],"tags":[957,962,1076,910],"class_list":["post-13737","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-community","category-konferenz","category-veranstaltungen","tag-dhd2020","tag-maschinelles-lernen","tag-operationalisierung","tag-reisestipendium"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13737","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/244"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=13737"}],"version-history":[{"count":4,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13737\/revisions"}],"predecessor-version":[{"id":13741,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13737\/revisions\/13741"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=13737"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=13737"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=13737"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}