{"id":10527,"date":"2018-11-02T09:45:37","date_gmt":"2018-11-02T08:45:37","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=10527"},"modified":"2018-11-05T09:52:52","modified_gmt":"2018-11-05T08:52:52","slug":"vorstellung-der-dariah-dh-award-preistraegerinnen-2018-thomas-schmidt","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=10527","title":{"rendered":"Vorstellung der DARIAH DH-Award-Preistr\u00e4gerInnen 2018: Thomas Schmidt"},"content":{"rendered":"<p><i>Mit dem\u00a0<\/i><a style=\"font-style: italic;\" href=\"https:\/\/dhd-blog.org\/?p=7883\">DARIAH-DE DH-Award<\/a><i>\u00a0wurde dieses Jahr Thomas Schmidt ausgezeichnet. Der DARIAH-DE DH-AWARD f\u00f6rdert NachwuchswissenschaftlerInnen, die in ihren Forschungsvorhaben innovative digitale Ans\u00e4tze und Methoden einsetzen und so einen Beitrag zur Weiterentwicklung der Digital Humanities leisten. Im DHd-Blog stellen wir Preistr\u00e4gerInnen und\u00a0Projekte in den n\u00e4chsten Wochen vor.<\/i><\/p>\n<p><em><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/09\/Bild.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-10528 size-medium\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/09\/Bild-253x300.jpg\" alt=\"\" width=\"253\" height=\"300\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Bild-253x300.jpg 253w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Bild.jpg 543w\" sizes=\"auto, (max-width: 253px) 100vw, 253px\" \/><\/a>Thomas Schmidt hat einen Master of Science in Medieninformatik von der Universit\u00e4t Regensburg. Thema der Masterarbeit: \u201eGef\u00fchl ist alles; Name ist Schall und Rauch.\u201c \u2013 Der Einsatz von Sentiment Analysis in der quantitativen Dramenanalyse.Seit Ende 2017 arbeitet er am Lehrstuhl f\u00fcr Medieninformatik der Universit\u00e4t Regensburg als wissenschaftlicher Mitarbeiter. Seine Forschungsinteressen umfassen Digital Humanities, Information Behavior und Human Computer Interaction.<\/em><\/p>\n<p><strong>Worum geht es in Ihrer Arbeit?<\/strong><\/p>\n<p>In der Masterarbeit habe ich mich mit der Sentiment Analysis auf Dramentexten von G. E. Lessing befasst. Sentiment Analysis bezeichnet dabei eine Sammlung von Methoden zur computergest\u00fctzten Analyse und Pr\u00e4diktion von Emotionen, Sentiments und Meinungen. Sentiment Analysis ist insbesondere im Bereich Product Reviews und Social Media popul\u00e4r. Es ist jedoch klar, dass insbesondere die Analyse von literarischen Texten davon profitieren kann; beispielsweise um Emotionsverl\u00e4ufe zu untersuchen oder die Beziehung zwischen Figuren zu modellieren. In der Arbeit habe ich zun\u00e4chst einen kleinen Teil von Repliken (also Sprechakten) aus den Dramen Lessings bez\u00fcglich dem Sentiment und den Emotionen annotieren lassen, um einen Gold Standard zu erstellen und das Annotationsverhalten zu untersuchen.\u00a0Details zu dieser Annotationsstudie kann man <a href=\"http:\/\/ceur-ws.org\/Vol-2155\/schmidt.pdf\">hier<\/a> einsehen.<\/p>\n<p>Bez\u00fcglich des Gold Standard habe ich dann die Leistung verschiedener lexikon-basierter (oder auch regel-basierter) Verfahren aus der Sentiment Analysis in Kombination mit NLP-Methoden evaluiert. Die besondere Herausforderung ist dabei der Umgang mit der historischer und poetischen Sprache. Die Ergebnisse der Sentiment Analysis aus der Methodenkombination mit der besten Leistung habe ich in einem <a href=\"http:\/\/lauchblatt.github.io\/QuantitativeDramenanalyseDH2015\/FrontEnd\/sa_selection.html\">prototypischen Web-Tool<\/a> zur interaktiven Visualisierung implementiert. \u00dcber das Tool kann man Polarit\u00e4ts- und Emotionsverteilungen in den Dramen Lessings explorieren. Mehr dazu kann man <a href=\"https:\/\/t.co\/GBHqctInOr\">hier<\/a> nachlesen.<\/p>\n<p>Betreut und begutachtet wurde die Masterarbeit von <a href=\"https:\/\/ch.uni-leipzig.de\/burghardt\/\">Jun.-Prof. Dr. Manuel Burghardt von der Universit\u00e4t Leipzig<\/a>\u00a0und <a href=\"https:\/\/www.uni-regensburg.de\/sprache-literatur-kultur\/medieninformatik\/sekretariat-team\/christian-wolff\/index.html\">Prof. Dr. Christian Wolff von der Universit\u00e4t Regensburg<\/a>.<\/p>\n<p><strong>Mit welchen Materialien und Daten arbeiten Sie?<\/strong><\/p>\n<p>F\u00fcr die Masterarbeit habe ich die Dramen von Lessing \u00fcber die Plattform Textgrid und das <a href=\"https:\/\/textgridrep.org\/\">Textgrid-Repository<\/a>\u00a0bezogen, da diese dort sehr gut als mit XML strukturierten und annotierten Dateien vorliegen. F\u00fcr Textanalyse jenseits von dem was auf Textgrid verf\u00fcgbar ist, nutze ich das bekannte <a href=\"http:\/\/gutenberg.spiegel.de\/\">Projekt Gutenberg<\/a>.<\/p>\n<p><strong>Gibt es Methoden, Theorien und Tools, welche f\u00fcr diese Aufgabe besonders interessant sind?<\/strong><\/p>\n<p>Bez\u00fcglich der theoretischen Grundlage bezieht man sich in der Sentiment Analysis meist auf Liu (2016) der zu dem Konzept Sentiment Analysis ein differenziertes theoretisches Modell erstellt hat. Problem hierbei ist, dass dieses Modell vor allem f\u00fcr Product Reviews, Social Media und Meinungen optimiert ist. Narrative und literarische Texte stellen jedoch einen Sonderfall dar, da die emotionalen Repr\u00e4sentationen oft sehr komplex sind oder auch die Bezugsebene nicht immer eindeutig zu identifizieren ist. Ich hoffe, dass wir mit unserer Forschung zum Annotationsverhalten von Literaturwissenschaftlern einen Beitrag zur Theoriebildung f\u00fcr die Sentiment Analysis auf literarischen Texten leisten.<\/p>\n<p>F\u00fcr die Durchf\u00fchrung der Sentiment Analysis habe ich etablierte deutschsprachige Sentiment-Lexika benutzt. Dabei handelt es sich um Listen oder Tabellen aus W\u00f6rtern, die bez\u00fcglich ihrem Sentiment auf unterschiedliche Art und Weise annotiert sind. \u00dcber Kalkulationen, basierend auf diesen Lexika, kann man dann Metriken f\u00fcr das Sentiment und Emotionen kalkulieren. Diese Methodik wird vor allem dann eingesetzt, wenn gro\u00dfe annotierte Korpora der Anwendungsdom\u00e4ne fehlen, um Techniken des maschinellen Lernens durchzuf\u00fchren.<\/p>\n<p>Im Bereich der allgemeinen Textverarbeitung und \u2013analyse nutze ich verschiedene Python-Libraries wie das bekannte <a href=\"https:\/\/www.nltk.org\/\"><em>NLTK-package<\/em><\/a>, <a href=\"https:\/\/textblob.readthedocs.io\/en\/dev\/\"><em>textblob<\/em><\/a>\u00a0 aber auch Lemmatisierungstools wie <a href=\"http:\/\/www.cis.uni-muenchen.de\/~schmid\/tools\/TreeTagger\/\"><em>TreeTagger<\/em><\/a>. Bei der Visualisierung der Daten habe ich mich an anderen Textanalyse-Tools orientiert, wie zum Beispiel <a href=\"https:\/\/voyant-tools.org\/\"><em>Voyant<\/em><\/a>\u00a0und nutze Datenvisualisierungs-Bibliotheken wie <a href=\"https:\/\/developers.google.com\/chart\/\">Google Charts<\/a>\u00a0und <a href=\"https:\/\/d3js.org\/\">D3.js<\/a>.<\/p>\n<p>Um mit der historischen Sprache der Dramen zurecht zu kommen, habe ich ein Tool vom <a href=\"http:\/\/www.deutschestextarchiv.de\/\">Deutschen Textarchiv<\/a> genutzt\u00a0 insbesondere ein Tool zur Erstellung historischer linguistischer Varianten von Jurish (2012).<\/p>\n<p>Um fortgeschrittene Methoden, wie zum Beispiel Machine Learning f\u00fcr die Sentiment Analysis zu verfolgen sind Sentiment-annotierte Korpora notwendig, die jedoch f\u00fcr den Anwendungsbereich von historischen Dramen noch nicht ausreichend vorliegen. Zwar gibt es gro\u00dfe und gut annotierte Korpora f\u00fcr andere Anwendungsbereiche (Product Reviews, Twitter), jedoch haben diese das Problem, dass es sich eben nicht um historische und poetische Sprache handelt. Auch haben wir festgestellt, dass Sentiment-Annotationen auf literarischen Texten detailliertere Annotationen ben\u00f6tigt, wie zum Beispiel die Angabe von L\u00fcgen, Ironie oder den tats\u00e4chlichen Sentiment-Zielen. Derartige Annotation sind selbst in etablierten Anwendungsgebieten nicht h\u00e4ufig. Diesbez\u00fcglich sind nat\u00fcrlich Annotations- und Crowdsourcing-Tools aus den Digital Humanities besonders interessant f\u00fcr uns, um gr\u00f6\u00dfere Annotationsstudien durchzuf\u00fchren und derartige Korpora zu generieren.<\/p>\n<p><strong>Wie haben Sie begonnen, sich mit digitalen Geisteswissenschaften zu besch\u00e4ftigen?<a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-10541 alignright\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie-212x300.jpg\" alt=\"\" width=\"212\" height=\"300\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie-212x300.jpg 212w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie-768x1086.jpg 768w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie-724x1024.jpg 724w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/09\/Thomas_Schmidt_Poster-Kopie.jpg 2000w\" sizes=\"auto, (max-width: 212px) 100vw, 212px\" \/><\/a><\/strong><\/p>\n<p>Zum ersten Mal habe ich mich mit Digital Humanities (DH) im Rahmen des Master-Programms f\u00fcr den Master Medieninformatik an der Universit\u00e4t Regensburg befasst. DH ist dabei ein Wahlmodul, das man belegen kann. Als Projektarbeit war ich im Kurs dann an der Realisierung eines <a href=\"http:\/\/lauchblatt.github.io\/QuantitativeDramenanalyseDH2015\/FrontEnd\/index.html\">Tools zur quantitativen Dramenanalyse<\/a> unter der Leitung von Jun.-Prof. Dr. Manuel Burghardt\u00a0beteiligt. Dabei habe ich auch erste Erfahrungen zur Zusammenarbeit mit Geisteswissenschaftlern gesammelt, da wir in dem Projekt eng mit der <a href=\"https:\/\/www.germanistik.uni-wuerzburg.de\/lehrstuehle\/computerphilologie\/mitarbeiter\/dennerlein\/\">Literaturwissenschaftlerin PD Dr. Katrin Dennerlein von der Universit\u00e4t W\u00fcrzburg<\/a>\u00a0zusammen gearbeitet haben.<\/p>\n<p>Im weiteren Studium habe ich dann immer mal wieder in Projektkursen an DH-Themen mitgewirkt, zum Beispiel bei der Digitalisierung einer Liedblattsammlung der Universit\u00e4t Regensburg. F\u00fcr meine Masterarbeit habe ich mich dann entschlossen auf den bisherigen Arbeiten zur quantitativen Dramenanalyse aufzubauen und die Dramenanalyse um Techniken der Sentiment Analysis zu erweitern.<\/p>\n<p>An den Digital Humanities interessiert mich vor allem die Vielfalt an Themen und die Zusammenarbeit mit Geisteswissenschaftlern. Des Weiteren finde ich die Zusammenf\u00fchrung von Geisteswissenschaften mit ihrer jahrhundertelangen Traditionen, Theorien und Ergebnissen und den M\u00f6glichkeiten der noch recht jungen Informatik sehr faszinierend und denke, dass sich beide Gebiete gegenseitig bereichern k\u00f6nnen.<\/p>\n<p><strong>Welche Angebote der digitalen Geisteswissenschaften f\u00e4nden Sie f\u00fcr Ihre Forschungsprojekte in Zukunft besonders hilfreich?<\/strong><\/p>\n<p>In Zukunft planen wir unter anderem noch gr\u00f6\u00dfere Annotationsstudien mit verschiedenen Nutzergruppen und differenzierteren Annotations-Schemata zur Sentiment Annotation auf literarischen Texten. Ziel ist die Analyse von Annotationsverhalten und die Erstellung von gr\u00f6\u00dferen Korpora zur Evaluation und zur Anwendung von Maschinellen Lernen. Daf\u00fcr exploriere ich momentan den Einsatz und die M\u00f6glichkeiten von bekannten Annotationstools wie <a href=\"https:\/\/webanno.github.io\/webanno\/\">WebAnno<\/a>\u00a0sowie Optionen die Annotation \u00fcber Crowdsourcing umzusetzen.<\/p>\n<p>Um besser mit historischer und poetischer Sprache der Dramentexte zurecht zukommen, w\u00e4ren nat\u00fcrlich mehr digitale W\u00f6rterb\u00fccher oder gar Sentiment-Lexika f\u00fcr den jeweiligen historischen Kontext n\u00fctzlich. Im Bereich der dom\u00e4nenspezifischen Sentiment Analysis gibt es auch semi-automatische Methoden f\u00fcr die Erstellung derartiger Lexika, die wir in Zukunft explorieren wollen.<\/p>\n<p>F\u00fcr die Weiterentwicklung der Dramenanalyse ist die Verkn\u00fcpfung von quantitativen Metriken aus dem vergangenen Projekt zur quantitativen Dramenanalyse mit Ergebnissen der Sentiment Analysis sicherlich interessant. Auch die Verkn\u00fcpfung und Integration von aktuell sehr popul\u00e4ren Textanalyse-Methoden wie Topic Modelling mit der Sentiment Analysis<\/p>\n<p><strong>Weitere Informationen:<\/strong><\/p>\n<ul>\n<li><a href=\"https:\/\/www.uni-regensburg.de\/sprache-literatur-kultur\/medieninformatik\/sekretariat-team\/thomas-schmidt\/index.html\">Thomas Schmidt<\/a>\u00a0\/ <a href=\"https:\/\/twitter.com\/thomasS_UniR\">@thomasS_UniR<\/a><\/li>\n<li><a href=\"https:\/\/www.uni-regensburg.de\/sprache-literatur-kultur\/medieninformatik\/index.html\">Lehrstuhl f\u00fcr Medieninformatik<\/a><\/li>\n<li><a href=\"https:\/\/dhregensburg.wordpress.com\/\">Digital Humanities Blog der Universit\u00e4t Regensburg<\/a><\/li>\n<li><a href=\"https:\/\/www.uni-regensburg.de\/sprache-literatur-kultur\/digital-humanities\/\">Webseite des Digital Humanities Master an der Universit\u00e4t Regensburg<\/a><\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<hr \/>\n<p><em><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2016\/10\/DARIAH-DE-Logo-mit-deutscher-Unterschrift-CMYK-1.1-700_0.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-7275\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2016\/10\/DARIAH-DE-Logo-mit-deutscher-Unterschrift-CMYK-1.1-700_0.jpg\" alt=\"\" width=\"150\" height=\"68\" \/><\/a><a href=\"http:\/\/de.dariah.eu\">DARIAH-DE<\/a>\u00a0unterst\u00fctzt mit digitalen Ressourcen und Methoden arbeitende Geistes- und KulturwissenschaftlerInnen in Forschung und Lehre.\u00a0Daf\u00fcr baut das Projekt eine digitale Forschungsinfrastruktur f\u00fcr Werkzeuge und Forschungsdaten auf und entwickelt Materialien f\u00fcr Lehre und Weiterbildung im Bereich der Digital Humanities (DH). DARIAH-DE ist der deutsche Beitrag von DARIAH-EU\u00a0und arbeitet in diesem Kontext mit einer Vielzahl von europ\u00e4ischen Partnern und Projektverb\u00fcndeten zusammen.<\/em><\/p>\n<p><a href=\"applewebdata:\/\/D2B81B06-7A7F-4B31-BCC5-7E4767EDDD1C#_ftnref1\" name=\"_ftn1\"><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mit dem\u00a0DARIAH-DE DH-Award\u00a0wurde dieses Jahr Thomas Schmidt ausgezeichnet. Der DARIAH-DE DH-AWARD f\u00f6rdert NachwuchswissenschaftlerInnen, die in ihren Forschungsvorhaben innovative digitale Ans\u00e4tze und Methoden einsetzen und so einen Beitrag zur Weiterentwicklung der Digital Humanities leisten. Im DHd-Blog stellen wir Preistr\u00e4gerInnen und\u00a0Projekte in den n\u00e4chsten Wochen vor. Thomas Schmidt hat einen Master of Science in Medieninformatik von der [&hellip;]<\/p>\n","protected":false},"author":193,"featured_media":10528,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-10527","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-allgemein"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10527","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/193"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=10527"}],"version-history":[{"count":5,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10527\/revisions"}],"predecessor-version":[{"id":10700,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/10527\/revisions\/10700"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/media\/10528"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=10527"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=10527"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=10527"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}