{"id":3275,"date":"2014-03-31T08:30:33","date_gmt":"2014-03-31T06:30:33","guid":{"rendered":"http:\/\/dhd-blog.org\/?p=3275"},"modified":"2014-03-29T19:58:11","modified_gmt":"2014-03-29T18:58:11","slug":"tatom-oder-text-analysis-with-topic-models-tutorial","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=3275","title":{"rendered":"TAToM, oder: Text Analysis with Topic Models (Tutorial)"},"content":{"rendered":"<div id=\"attachment_3277\" style=\"width: 397px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2014\/03\/racine-topic-heatmap1.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-3277\" class=\" wp-image-3277 \" alt=\"Eine &quot;topic heatmap&quot; f\u00fcr die Trag\u00f6dien von Jean Racine\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2014\/03\/racine-topic-heatmap1.png\" width=\"387\" height=\"240\" \/><\/a><p id=\"caption-attachment-3277\" class=\"wp-caption-text\">Eine &#8222;topic heatmap&#8220; f\u00fcr die Trag\u00f6dien von Jean Racine<\/p><\/div>\n<p>Die Schulungsmaterialien &#8222;<a href=\"https:\/\/de.dariah.eu\/tatom-intro\">TAToM &#8211; Text Analysis with Topic Models for the Humanities and Social Sciences<\/a>&#8222;, die von <a href=\"http:\/\/ariddell.org\/\">Allen Riddell<\/a> im Rahmen von DARIAH-DE erstellt wurden, sind soeben erschienen.<!--more--><\/p>\n<p>Sie bestehen aus einer Serie von Tutorials, die grundlegende Verfahren der quantitativen Textanalyse abdecken. Sie thematisieren die Vorbereitung eines Textkorpus f\u00fcr die Analyse sowie die Exploration von Textsammlungen mit Verfahren wie Topic Modeling und Maschinellem Lernen. Besonderes Augenmerk liegt darauf, dass NutzerInnen weitestgehende Kontrolle \u00fcber die Vorg\u00e4nge der Textprozessierung behalten k\u00f6nnen. Wichtig war bei der Entwicklung der Materialien dar\u00fcber hinaus, den Aspekt der Visualisierung von Topic Models mit in das Verfahren einzubeziehen.<\/p>\n<p>Die Tutorials behandeln sowohl einige grundlegende als auch fortgeschrittene Themen und bauen in gewisser Weise auf den Materialien zu <a href=\"http:\/\/fbkarsdorp.github.io\/python-course\/\">Python Programming for the Humanities<\/a> von Folgert Kastorp und Maarten van Gompel auf bzw. setzen diese teilweise voraus. Die Tutorials nutzen in erster Linie die beliebte Skriptsprache <a href=\"https:\/\/www.python.org\/\">Python<\/a>, um mit den Textdaten umzugehen.<\/p>\n<p>Die Inhalte in der \u00dcbersicht:<br \/>\n&#8211; Preliminaries &amp; Getting started<br \/>\n&#8211; Working with text<br \/>\n&#8211; Preprocessing<br \/>\n&#8211; Feature selection: finding distinctive words<br \/>\n&#8211; Topic modeling with MALLET<br \/>\n&#8211; Topic modeling in Python<br \/>\n&#8211; Visualizing topic models<br \/>\n&#8211; Classification, Machine Learning, and Logistic Regression<br \/>\n&#8211; Case Study: Racine&#8217;s early and late tragedies<\/p>\n<p>Die Tutorials wurden von Allen Riddell f\u00fcr DARIAH-DE verfasst und im M\u00e4rz 2014 in Version 1.0 ver\u00f6ffentlicht. Die Koordination lag bei Christof Sch\u00f6ch am Lehrstuhl f\u00fcr Computerphilologie der Universit\u00e4t W\u00fcrzburg. R\u00fcckmeldung zu den Tutorials ist immer willkommen, ebenso wie Hinweise auf Fehler. Bitte nutzen Sie hierf\u00fcr den <a href=\"https:\/\/github.com\/ariddell\/tatom\/\">issue tracker auf GitHub<\/a>. Die Tutorials werden unter der Lizenz Creative Commons Attribution 4.0 International zur Verf\u00fcgung gestellt.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Schulungsmaterialien &#8222;TAToM &#8211; Text Analysis with Topic Models for the Humanities and Social Sciences&#8222;, die von Allen Riddell im Rahmen von DARIAH-DE erstellt wurden, sind soeben erschienen.<\/p>\n","protected":false},"author":37,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[23,242],"tags":[398,204,400,206,399,397],"class_list":["post-3275","post","type-post","status-publish","format-standard","hentry","category-forschung-methode","category-lehre-und-ausbildung","tag-allen-riddell","tag-dariah-de","tag-inhaltsanalyse","tag-python","tag-textanalyse","tag-topic-modeling"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/3275","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/37"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3275"}],"version-history":[{"count":3,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/3275\/revisions"}],"predecessor-version":[{"id":3280,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/3275\/revisions\/3280"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3275"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3275"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3275"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}