DH- Workshops in Tübingen: Publishing Data und Topic Modeling
Am 8. und 9. Februar veranstaltet der Lehrstuhl für Romanische Philologie der Universität Tübingen zwei Workshops zum Thema „Publishing Data using GitHub“ von José Calvo Tello und „Einführung in Topic Modeling“ von Ulrike Henny-Krahmer (beide Universität Würzburg).
Die Teilnehmeranzahl ist beschränkt, um Anmeldung wird bis zum 1. Februar gebeten, per mail an Frau Ehrt: monika.ehrt@uni-tuebingen.de
„Publishing Data using GitHub“ (8.2.2018, 17-21 Uhr, Brechtbau, Raum 206)
GitHub has become a well established tool for versioning, sharing and publishing code and data. Once the basic work flow and concepts are understood, it is a straightforward and elegant tool, but the first steps can be a challenge. This first stage is the focus of this 3 hours workshop, in which we will have time to try and publish our own data or code. We will also explore some interesting functions like GitHub.io and its integration with the European archiving project Zenodo.
Prerequisites
Bring your own Laptop and take in consideration that although we can use GitHub in the different OS (Windows, Mac and Ubuntu), the majority of the documentation is thought for Mac or Ubuntu. Create your own account in https://github.com/. It is highly recommendable that you bring your own data (corpus, frequencies, database, edition…) to use it in the tests and have already your own repository published by the end of the workshop.
Contact: José Calvo Tello, jose.calvo@uni-wuerzburg.de
„Einführung in Topic Modeling“ (9.2.2018, 9-12 Uhr, Brechtbau, Raum 106)
Topic Modeling ist eine quantitative Methode für Textanalyse, mit der thematische Muster in großen Textsammlungen aufgedeckt werden können. Das Verfahren ist in den letzten Jahren auch vermehrt für geisteswissenschaftliche Fragestellungen eingesetzt worden (u.a. Rhody 2012, Jockers 2013, Schöch 2017 für literarische Texte, Blevins 2010, Kaufman 2015 für historische Analysen). Im Workshop wird ein Überblick über die Funktionsweise und die Anwendungsbereiche des Verfahrens gegeben. Anschließend können die Teilnehmer Topic Modeling mit dem Tool MALLET und Übungs-Korpora testen. Gemeinsam soll der Topic Modeling-Workflow von der Aufbereitung der Texte bis hin zur Auswertung von Ergebnissen diskutiert werden.
Literaturhinweise
Blevins, Cameron (2010): „Topic Modeling Martha Ballard’s Diary.“ Blog Posts. http://www.cameronblevins.org/posts/topic-modeling-martha-ballards-diary/
Jockers, Matthew L. (2013). Macroanalysis. Digital Methods & Literary History. Urbana, Chicago, and Springfield: University of Illinois Press.
Kaufman, Micki (2015): „Everything on Paper Will Be Used Against Me:“ Quantifying Kissinger. A Computational Analysis of the National Security Archive’s Kissinger Collection Memcons and Telcons. Blog Posts. http://blog.quantifyingkissinger.com/
McCallum, Andrew Kachites (2002). „Topic Modeling.“ MALLET. MAchine Learning for LanguagE Toolkit. http://mallet.cs.umass.edu/topics.php
Rhody, Lisa M. (2012): „Topic Modeling and Figurative Language.“ In: Journal of Digital Humanities, Vol. 2, No. 1. http://journalofdigitalhumanities.org/2-1/topic-modeling-and-figurative-language-by-lisa-m-rhody/
Schöch, Christof (2017): „Topic Modeling Genre: An Exploration of French Classical and Enlightenment Drama.“ In: Digital Humanities Quarterly, Vol. 11, No. 2. http://www.digitalhumanities.org/dhq/vol/11/2/000291/000291.html
Voraussetzungen
Bitte bringen Sie zum Workshop einen Laptop mit, auf dem MALLET bereits installiert ist. Hinweise zur Installation sind auf der MALLET-Webseite zu finden: http://mallet.cs.umass.edu/download.php. Relevant sind hier nur die Hinweise unter „Current release“ und „Windows installation“, nicht unter „Development release“. Es reicht aus, das MALLET-Verzeichnis herunterzuladen und zu entpacken, ohne weiteren Installationsvorgang. Voraussetzung dafür, dass MALLET läuft, ist außerdem eine Installation des Java Development Kit (JDK). Nähere Hinweise dazu, wie man Java und MALLET installieren kann, gibt es auch in folgendem Tutorial: https://programminghistorian.org/lessons/topic-modeling-and-mallet#installing-mallet. Bitte melden Sie sich vor der Veranstaltung, falls es Fragen zur Installation gibt.
Kontakt:
Ulrike Henny-Krahmer, ulrike.henny@uni-wuerzburg.de
Kommentar schreiben