{"id":10627,"date":"2018-10-16T14:42:31","date_gmt":"2018-10-16T12:42:31","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=10627"},"modified":"2018-10-16T14:42:31","modified_gmt":"2018-10-16T12:42:31","slug":"bericht-workshop-text-reuse-und-distributionelle-semantik","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=10627","title":{"rendered":"Bericht: Workshop &#8222;Text Reuse und distributionelle Semantik&#8220;"},"content":{"rendered":"<p class=\"western\">Am 16. Und 17. Juli 2018 fand im Kloster Jakobsberg bei Mainz ein Methodenworkshop zum Thema <em>Text Reuse und distributionelle Semantik<\/em> statt. Am Methodenworkshop nahmen Studierende des Masterstudiengangs &#8222;Digitale Methodik in den Geistes- und Kultuwissenschaften&#8220; der <span lang=\"de-DE\">Johannes Gutenberg-<\/span>Universit\u00e4t Mainz, teil, um ihr Wissen im Bereich der NLP zu vertiefen. Der Schwerpunkt des 1,5-t\u00e4gigen Workshops lag <span lang=\"de-DE\">auf dem<\/span> Ausprobieren und Vergleichen zweier <span lang=\"de-DE\">t<\/span>extanalytischen Werkzeuge: <i>TRACER<\/i> (<span style=\"color: #000080\"><span lang=\"zxx\"><u><a class=\"western\" href=\"https:\/\/www.etrap.eu\/research\/tracer\/\"><span style=\"color: #0000ff\">https:\/\/www.etrap.eu\/research\/tracer\/<\/span><\/a><\/u><\/span><\/span>)<i> <\/i>und <i>DARIAH-DE Topics Explorer <\/i>(<span style=\"color: #000080\"><span lang=\"zxx\"><u><a class=\"western\" href=\"https:\/\/dariah-de.github.io\/TopicsExplorer\/\"><span style=\"color: #0000ff\">https:\/\/dariah-de.github.io\/TopicsExplorer\/<\/span><\/a><\/u><\/span><\/span>). <i>TRACER <\/i>ist ein textanalytisches Programm, entwickelt von Marco B\u00fcchler innerhalb des eTRAP-Projekts, das<span lang=\"de-DE\"> es erm\u00f6glicht<\/span> <span lang=\"de-DE\">die <\/span>Verwendung <span lang=\"de-DE\">von<\/span> (auch paraphrasierten) Textpassagen\/S\u00e4tzen in fremden Texten festzustellen.<span lang=\"de-DE\"> Das Programm<\/span> <i>Topics Explorer<\/i><span lang=\"de-DE\">, das <\/span>an der Universit\u00e4t W\u00fcrzburg, Lehrstuhl f\u00fcr Computherphilogie i<span lang=\"de-DE\">m<\/span> Rahmen de<span lang=\"de-DE\">s<\/span> DARIAH-DE-Projekts<span lang=\"de-DE\"> entwickelt wurde<\/span>, ist in der Lage<span lang=\"de-DE\"> die<\/span> Themen <span lang=\"de-DE\">innerhalb<\/span> gro\u00dfe<span lang=\"de-DE\">r<\/span> Textsammlungen zu bestimmen.<\/p>\n<p class=\"western\">Studierende bereiteten im Voraus eigene Datens\u00e4tze und dazu passende Fragestellungen vor<span lang=\"de-DE\">,<\/span> mit denen sie an d<span lang=\"de-DE\">i<\/span><span lang=\"de-DE\">e<\/span> digitalen Werkzeuge herantraten. Wichtig war dabei<span lang=\"de-DE\">,<\/span> den <span lang=\"de-DE\">vollst\u00e4ndigen<\/span> Prozess <span lang=\"de-DE\">\u2013<\/span>angefangen von der Datenvorbereitung bis zur Anwendung der Programme <span lang=\"de-DE\">\u2013 <\/span>selbst\u00e4ndig in Gruppen durchzuf\u00fchren und abschlie\u00dfend in Kurzvortr\u00e4gen vorzustellen.<\/p>\n<p class=\"western\">D<span lang=\"de-DE\">ie<\/span> Themen Text Reuse, Zipfische<span lang=\"de-DE\">s<\/span> Gesetz und das Funktionieren des Programms TRACER wurde<span lang=\"de-DE\">n<\/span> von Marco B\u00fcchler vorgestellt und erl\u00e4utert . Nach dem Installieren des Programms,<span lang=\"de-DE\"> der \u00dc<\/span>berpr\u00fcf<span lang=\"de-DE\">ung<\/span> der aktuellen Java<span lang=\"de-DE\">&#8211;<\/span>Versions und <span lang=\"de-DE\">der N<\/span>ormalisier<span lang=\"de-DE\">ung<\/span> der Daten konnten Studierende eigene Analysen durchf\u00fchren. <span lang=\"de-DE\">Die s<\/span>ehr heterogene<span lang=\"de-DE\">n<\/span> Datengrundlagen reichten von modernen Song- bis zu Bibeltexten und so war es wichtig f\u00fcr jede Gruppe zu verstehen welche Einstellungen der Parameter die Textreuse Ergebnisse beeinflussen.<\/p>\n<p class=\"western\">Steffen Pielstr\u00f6m, Michael Huber und Stefan Krywinski stellten das Thema Topic Modeling und das dazugeh\u00f6rige Tool DARIAH-DE Topics Explorer vor. Der Topics Explorer ist ein Textmining <span lang=\"de-DE\">Programm<\/span>, das vorgegebene Anzahl der Themen innerhalb eines Textkorpus bestimmen kann. Auch beim Topics Explorer konnten Studierende die Stufen von der Datenvorbereitung hin zur Modellerstellung durchgehen und <span lang=\"de-DE\">sich <\/span>Visualisierungen der Themen in jeweiligen Textkorpora <span lang=\"de-DE\">anzeigen lassen<\/span>. In abschlie\u00dfenden Diskussionen <span lang=\"de-DE\">wurde<\/span> auch das Thema Tool Kritik angesprochen und die St\u00e4rken und Schw\u00e4chen beider Verfahren <span lang=\"de-DE\">abgewogen<\/span>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Am 16. Und 17. Juli 2018 fand im Kloster Jakobsberg bei Mainz ein Methodenworkshop zum Thema Text Reuse und distributionelle Semantik statt. Am Methodenworkshop nahmen Studierende des Masterstudiengangs &#8222;Digitale Methodik in den Geistes- und Kultuwissenschaften&#8220; der Johannes Gutenberg-Universit\u00e4t Mainz, teil, um ihr Wissen im Bereich der NLP zu vertiefen. Der Schwerpunkt des 1,5-t\u00e4gigen Workshops lag [&hellip;]<\/p>\n","protected":false},"author":158,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-10627","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10627","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/158"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=10627"}],"version-history":[{"count":2,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10627\/revisions"}],"predecessor-version":[{"id":10629,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10627\/revisions\/10629"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=10627"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=10627"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=10627"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}