{"id":2532,"date":"2013-10-31T22:22:48","date_gmt":"2013-10-31T21:22:48","guid":{"rendered":"http:\/\/dhd-blog.org\/?p=2532"},"modified":"2013-10-31T22:22:48","modified_gmt":"2013-10-31T21:22:48","slug":"computerlinguistik-und-digital-humanities","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=2532","title":{"rendered":"Computerlinguistik und Digital Humanities"},"content":{"rendered":"<p>In einem Kommentar zu meinem <a title=\"Kurzer Bericht von der GSCL 2013 in Darmstadt\" href=\"https:\/\/dhd-blog.org\/?p=2418\">Kurzbericht von der GSCL 2013<\/a> hat Patrick Sahle folgendes geschrieben:<\/p>\n<blockquote><p>Das finde ich spannend: Computerlinguistik\/Sprachtechnologie ist<br \/>\nnach diesem Beitrag KEIN \u201cTeil\u201d von DH, sondern macht (auch) Sachen,<br \/>\ndie f\u00fcr DH relevant sind.<\/p>\n<p>Michael, k\u00f6nntest Du ein paar Hinweise dazu geben,<br \/>\na) wieso CL\/ST nicht als Teil der DH aufzufassen sind und<br \/>\nb) wie Du DH definierst, so dass man daraus ableiten kann, welche<br \/>\nCL\/ST-Themen f\u00fcr die DH einschl\u00e4gig\/relevant\/interessant sind<br \/>\n?<br \/>\nDas w\u00fcrde bei mir vermutlich vieles erhellen.<\/p><\/blockquote>\n<p>Ich m\u00f6chte hier zun\u00e4chst Frage (a) beantworten, also die Frage, ob Computerlinguistik (CL) und Sprachtechnologie (NLP) ein \u00bbTeil\u00ab der Digital Humanities sind. Diese Frage f\u00fchrt nat\u00fcrlich direkt zur Frage, was die Digital Humanities sind. In <a title=\"NLP for Historical Texts\" href=\"http:\/\/dx.doi.org\/10.2200\/S00436ED1V01Y201207HLT017\" target=\"_blank\">meinem Buch<\/a> definiere ich sie wie folgt:<\/p>\n<blockquote><p>The emerging field of digital humanities aims to exploit the\u00a0possibilities offered by digital data for humanities research. The\u00a0digital humanities combine traditional qualitative methods with\u00a0quantitative, computer-based methods and tools, such as information\u00a0retrieval, text analytics, data mining, visualization, and\u00a0geographic information systems (GIS).<\/p><\/blockquote>\n<p>Nach meiner Definition ist DH also die Erg\u00e4nzung traditioneller geisteswissenschaftlicher Methoden durch rechnergest\u00fctzte quantitative Methoden und Werkzeuge zur Beantwortung geisteswissenschaftlicher Forschungsfragen.<\/p>\n<p>Was ist unter CL und NLP zu verstehen? CL und NLP h\u00e4ngen eng zusammen, im \u00fcblichen Sprachgebrauch wird CL meist f\u00fcr st\u00e4rker linguistisch und theoretisch orientierte Forschung verwendet, w\u00e4hrend NLP nicht umsonst oft auch als \u00bblanguage engineering\u00ab bezeichnet wird: Hier geht es nicht um linguistische Forschungsfragen, sondern prim\u00e4r darum, effektive und effiziente Algorithmen, Datenstrukturen usw. f\u00fcr die Verarbeitung nat\u00fcrlicher Sprachen zu erforschen und f\u00fcr praktische Anwendungen nutzbar zu machen. Ein gutes Beispiel daf\u00fcr ist die aktuelle Forschung im Bereich der maschinellen \u00dcbersetzung (M\u00dc).<br \/>\nDiese Definition nimmt bereits einen Teil der Antwort vorweg: NLP ist meines Erachtens kein Teil der DH, da sich NLP nicht mit geisteswissenschaftlichen Forschungsfragen besch\u00e4ftigt. Die Situation ist vergleichbar mit der Rolle von NLP in der Pharmaforschung: Biomedizinisches Textmining spielt ein wichtige Rolle, dennoch ist Sprachtechnologie kein Teil der Pharmazie.<\/p>\n<p>Auch wenn NLP kein Teil der DH ist, ist NLP aber eine wichtige Grundlage, oder, wie ich es in meinem Buch (S. 10) ausgedr\u00fcckt habe: \u00bbNLP\u2014and NLP for historical texts in particular\u2014should be considered a foundation for the emerging discipline of digital humanities.\u00ab<br \/>\nWenn Computerlinguistik und Sprachtechnologie nicht das selbe sind, wie sieht es dann mit der Computerlinguistik aus? Die Linguistik wird ja \u00fcblicherweise zu den Geisteswissenschaften gerechnet.<\/p>\n<p>Zun\u00e4chst ist hier zu beachten, dass die Linguistik eine der \u00bbnaturwissenschaftlichsten\u00ab geisteswissenschaftlichen Disziplinen ist; ihre Methoden unterscheiden sich deutlich von \u2013 zum Beispiel \u2013 der Geschichtswissenschaft oder der Literaturwissenschaft.<br \/>\nDazu kommt, dass sich die Computerlinguistik in den letzten 50 Jahren weitgehend von der Linguistik emanzipiert hat. Nat\u00fcrlich gibt es noch Forscher in der Computerlinguistik, die linguistische Fragestellungen bearbeiten, der Mainstream hat sich aber stark in Richtung NLP entwickelt. Wissensfreie statistische Verfahren haben sich etabliert, und angesichts der schnellen Erfolge, die man mit ihnen insbesondere in der M\u00dc erreicht hat, muss man sich heutzutage f\u00fcr regelbasierte, linguistisch motivierte Ans\u00e4tze oft rechtfertigen. Die geringe Rolle der Linguistik in der Computerlinguistik wird andererseits aber auch seit einiger Zeit innerhalb der CL diskutiert (siehe etwa die Proceedings des\u00a0<a href=\"http:\/\/www.aclweb.org\/anthology\/W\/W09\/W09-01.pdf\" target=\"_blank\">EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics<\/a>\u00a0oder die Artikel\u00a0<a href=\"http:\/\/www.mitpressjournals.org\/doi\/abs\/10.1162\/coli.2007.33.3.437\" target=\"_blank\">Computational Linguistics: What About the Linguistics?<\/a>\u00a0von Karen Sp\u00e4rck Jones und\u00a0<a href=\"http:\/\/www.mitpressjournals.org\/doi\/abs\/10.1162\/coli.2009.35.4.35409\" target=\"_blank\">What Science Underlies Natural Language Engineering?<\/a>\u00a0von\u00a0Shuly Wintner).<\/p>\n<p>Ich w\u00fcrde daher auch die heutige CL nicht \u2013 jedenfalls nicht als Ganzes \u2013 als Teil der DH betrachten. Da die CL aber eine der Grundlagen f\u00fcr NLP sind, sind sie auch eine Grundlage f\u00fcr DH.<\/p>\n<p>CL-Forschung mit einer st\u00e4rkeren linguistischen Ausrichtung \u2013 also quasi die \u00bbklassische\u00ab CL, bei der es um die rechnergest\u00fctzte Modellierung sprachlicher Ph\u00e4nomene geht, um ein besseres Verst\u00e4ndnis von nat\u00fcrlicher Sprache zu erreichen \u2013 k\u00f6nnte man durchaus als Teil der DH betrachten, diese Forschung ist aber heute eher in der Korpuslinguistik angesiedelt.<br \/>\nDie Antwort auf die Frage (a) ist jetzt schon recht lang geraten, daher werde ich mich mit (b) in einem weiteren Beitrag besch\u00e4ftigen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In einem Kommentar zu meinem Kurzbericht von der GSCL 2013 hat Patrick Sahle folgendes geschrieben: Das finde ich spannend: Computerlinguistik\/Sprachtechnologie ist nach diesem Beitrag KEIN \u201cTeil\u201d von DH, sondern macht (auch) Sachen, die f\u00fcr DH relevant sind. Michael, k\u00f6nntest Du ein paar Hinweise dazu geben, a) wieso CL\/ST nicht als Teil der DH aufzufassen sind [&hellip;]<\/p>\n","protected":false},"author":60,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[103,11,10,268],"tags":[269,33],"class_list":["post-2532","post","type-post","status-publish","format-standard","hentry","category-community","category-forschung","category-reflektion","category-theorie","tag-computerlinguistik","tag-digital-humanities"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2532","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/60"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2532"}],"version-history":[{"count":1,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2532\/revisions"}],"predecessor-version":[{"id":2533,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/2532\/revisions\/2533"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2532"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2532"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2532"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}