Neues Heft des „Journal for Language Technology and Computational Linguistics“ mit dem Titel „Corpora and Resources for (Historical) Low Resource Languages“ veröffentlicht
Im Februar 2016 fand an der Goethe Universität Frankfurt der Workshop “Corpora and Resources for Low Resource Languages with a Special Focus on Historical Languages” statt, organisiert in Kooperation der GSCL-Arbeitskreise Korpuslinguistik und Historisch-Vergleichende Sprachwissenschaft mit dem CEDIFOR der Goethe-Universität.
Während für viele, vor allem für größere Sprachen mittlerweile eine gute bis sehr gute technologische Infrastruktur bereitsteht, ist dies im Bereich so genannter Low Resource Languages (LRL), wie z.B. historischer Sprachen in vielerlei Hinsicht (Standardtools, annotatierte Korpora etc.) trotz ihrer Bedeutung noch nicht der Fall. Die Situation verbessert sich stetig durch Initiativen, Infrastrukturprojekte und Organisationen, welche sich der Erschließung von LRL verschrieben haben wie beispielsweise CLARIN, ELRA oder DOBES und so für einen stetig besser werdenden Zugang zu Sprachressourcen sorgen. Der Workshop richtete sich an WissenschaftlerInnen, die in einem der Kontexte zu LRL Sprachen forschen und wollte Ihnen ein Austauschforum bieten.
Das vorliegende Heft des JLCL versammelt im Nachgang zu diesem Workshop nunmehr ausgewählte Beiträge, welche in diesem Kontext entstanden sind. Der erste Beitrag von Florian Petran, Marcel Bollmann, Stefanie Dipper und Thomas Klein stellt mit ReM ein Referenzkorpus des Mittelhochdeutschen vor, das insgesamt ca. 2,5 Millionen Token (in ca. 400 Texten) umfasst. Der zweite Beitrag von Roland Mittmann beschreibt eine Methode zur automatischen dialektalen Einordnung althochdeutscher Wortformen. Der dritte Beitrag von Armin Hoenen und Lela Samushia stellt ein altgeorgisches Inschriftenkorpus vor und präsentiert Front- und Backend eines Tools, das aufzeigt, welche Eigenschaften wichtig sind, um bei der Entschlüsselung und Rekonstruktion der Botschaft von oft nur fragmentarisch überlieferten Inschriften zu helfen.
Das „Journal for Language Technology and Computational Linguistics“ ist eine zweimal jährlich, ausschließlich online erscheinende Zeitschrift (www.jlcl.org). Als Publikationsorgan der deutschen „Gesellschaft für Sprachtechnologie und Computerlinguistik“ (GSCL) widmet es sich der Publikation von wissenschaftlichen Beiträgen zu computerlinguistischen Themen. Das Journal hat in den letzten Jahren einen deutlichen Fokus auf Ressourcen und Methoden, die auch für das Feld der „Digital Humanities“ relevant sind. Die Herausgeber folgen dem Publikationsmodell des „Open Access“.
Kommentar schreiben