Kurzer Bericht von der GSCL 2013 in Darmstadt
Die diesjährige Tagung der Gesellschaft für Sprachtechnologie und Computerlinguistik (GSCL 2013) fand vom 25. bis zum 27. September 2013 an der TU Darmstadt statt, mit Workshops am 23. September und Tutorials am 24. September. Ich berichte aus zwei Gründen hier im DHd-Blog über die GSCL 2013: Zum einen hat man mich freundlich darum gebeten, zum anderen wies GSCL 2013 eine bemerkenswerte Anzahl von Beiträgen mit DH-Bezug auf.
Zu den Workshops kann ich leider nichts sagen, da ich am Montag noch nicht in Darmstadt war, hier verweise ich aufs Workshop-Programm. Im Tutorial-Programm am Dienstag waren die Digital Humanities zweifach vertreten, vormittags mit meinem Tutorial »Natural Language Processing for Historical Texts« (Folien), nachmittags mit »Text Analysis and Mining for Digital Humanities« (gehalten von Caroline Sporleder, Universität Trier).
Die eigentliche Konferenz wurde am 25. September mit einem eingeladenen Vortrag »Big Data and Text Analytics« von Hans Uszkoreit (DFKI) eröffnet. Danach gab es zwei parallele Sessions, von denen sich eine mit Sprachverarbeitung für Social-Media-Texten beschäftigte (Melanie Neunerdt, Bianka Trevisan, Michael Reyer, Rudolf Mathar: »Part-of-Speech Tagging for Social Media Texts«, Ines Rehbein: »Fine-Grained POS Tagging of German Twitter Data«, Manuel Burghardt, Alexander Bazo, Christian Wolff: »TWORPUS – An Easy-to-Use Tool for the Creation of Tailored Twitter Corpora«) und die andere mit computerlinguistischen Themen (Sabine Schulte Im Walde, Maximilian Köper: »Pattern-based Distinction of Paradigmatic Relations for German Nouns, Verbs, Adjectives«, Noëmi Aepli, Martin Volk: »Reconstructing Complete Lemmas for Incomplete German Compounds«, Thomas Bögel, Anette Frank: »A Joint Inference Architecture for Global Coreference Clustering with Anaphoricity«).
Nach der Mittagspause trugen die Kandidaten für den GSCL-Preis für die beste studentische Abschlussarbeit vor:
- Marcel Bollmann (Ruhr-Universität Bochum): »Automatic Normalization for Linguistic Annotation of Historical Language Data« – auch das ein Thema mit starkem Digital-Humanities-Bezug –,
- Yevgen Chebotar (TU Darmstadt): »Dialog Act Classification in Wikipedia Discussion Pages« und
- Steffen Remus: »Automatically Identifying Lexical Chains by Means of Statistical Methods – A Knowledge-Free Approach«.
Im Anschluss fand die Mitgliederversammlung der GSCL statt. Aus DH-Perspektive ist insbesondere berichtenswert, dass die Mitglieder einstimmig die Einrichtung des Arbeitskreises »CL4DH: Computerlinguistik für Digital Humanities« guthießen. Der Arbeitskreis wird von Anette Frank (Universität Heidelberg) und Anke Lüdeling (HU Berlin) geleitet. Ziel des Arbeitskreises ist es, die Leistungsfähigkeit computerlinguistischer Werkzeuge und Verfahren für den Einsatz in den Digital Humanities zu verbessern. Hierfür sollen spezielle Bedürfnisse, Fragestellungen und Interessensgebiete aus den Digital Humanities in eine gemeinsame Forschungsagenda aufgenommen werden. Außerdem sollen Desiderata der aktuellen computerlinguistischen Forschung für das Deutsche analysiert werden, um durch Community-Aktivitäten die Qualität computerlinguistischer Werkzeuge für den Einsatz in den Digital Humanities zu verbessern. Weitere Informationen zum Arbeitskreis finden sich auf seiner Webseite.
Der Donnerstag begann mit einer Poster-Session. Aus einer DH-Perspektive möchte ich hier vor allem die Poster »Technological Support for Older Germanic Languages« (Christian Chiarcos, Timothy Price, Maria Sukhareva) und »Erkennung interpersonaler Relationen in XML-kodierten Texten mit lokalen Grammatiken« (Sophia Stotz, Valentina Stuss) hervorheben.
Bei den folgenden parallelen Paper-Sessions hatte vor allem Claes Neuefeinds Vortrag »Collaboratively Building Corpora – a Case Study for Romansh« einen DH-Bezug. Nach der Mittagspause gab es eine weitere Poster-Session, bei der auch wieder mehrere Arbeiten mit DH-Bezug vorgestellt wurden, etwa »Building and Analyzing a Massively Parallel Bible Corpus« (Thomas Mayer, Michael Cysouw) und »Computational Humanities« (Alexander Mehler, Rüdiger Gleim, Andy Lücking, Giuseppe Abrami, Tim vor der Brück, Zahurul Islam, Armin Hoenen).
Anschließend gab es einen weiteren eingeladenen Vortrag, »Distributed Wikipedia LDA« von Massimiliano Ciaramita. Danach wurde der GSCL-Preis für die beste studentische Abschlussarbeit verliehen, und zwar an Marcel Bollmann – und damit für eine Arbeit mit starkem DH-Bezug, siehe oben. Der Tag endete mit dem sehr gelungenen Konferenzdinner im Biergarten »Zum Scheinheil’gen«.
Der Freitag begann mit dem eingeladenen Vortrag »Multimodal Sentiment Analysis« von Rada Mihalcea und der Verleihung der GSCL-Ehrenmitgliedschaft an Burghard Rieger. Leider konnte ich an der abschließenden Kaleidoskop-Session nicht mehr teilnehmen, an der weitere Arbeiten mit DH-Bezug vorgestellt wurden; dazu gehörten die Vorstellung des Arbeitskreises »Computerlinguistik für Digital Humanities« durch Anette Frank und Anke Lüdeling, »Digital Humanities Text Analysis: Needs and Deeds« von Sabine Bartsch und Andrea Rapp, »SeNeReKo – Netzwerkanalyse für die Religionsgeschichte« von Frederik Elwert und »Graph Databases for the Exploration of Large Corpora in the eHumanities« von Thomas Efer.
Je nach Forschungsfrage sind natürlich noch weitere als die genannten Vorträge und Poster für Forscher in den Digital Humanities interessant; ich habe mich hier auf die beschränkt, bei denen der Bezug explizit ist und verweise auf die Proceedings. Festzuhalten ist auf jeden Fall, dass die Digital Humanities in der Computerlinguistik als interessantes Anwendungsgebiet wahrgenommen werden und sich als solches auch etabliert haben.
Patrick Sahle
Das finde ich spannend: Computerlinguistik/Sprachtechnologie ist nach diesem Beitrag KEIN „Teil“ von DH, sondern macht (auch) Sachen, die für DH relevant sind.
Michael, könntest Du ein paar Hinweise dazu geben,
a) wieso CL/ST nicht als Teil der DH aufzufassen sind und
b) wie Du DH definierst, so dass man daraus ableiten kann, welche CL/ST-Themen für die DH einschlägig/relevant/interessant sind
?
Das würde bei mir vermutlich vieles erhellen. Danke und Grüße, Patrick
Michael Piotrowski
Hallo Patrick,
danke für die fragen! Da die antwort dieses textfeld sprengen würde, habe ich einen eigenen artikel daraus gemacht.