{"id":5995,"date":"2015-12-06T12:26:46","date_gmt":"2015-12-06T11:26:46","guid":{"rendered":"http:\/\/dhd-blog.org\/?p=5995"},"modified":"2015-12-07T07:18:44","modified_gmt":"2015-12-07T06:18:44","slug":"noch-einmal-was-sind-geisteswissenschaftliche-forschungsdaten","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=5995","title":{"rendered":"Noch einmal: Was sind geisteswissenschaftliche Forschungsdaten?"},"content":{"rendered":"<p>Der von Peter Andorfer in den Dariah Working Papers erschienene Beitrag zu <a href=\"http:\/\/nbn-resolving.de\/urn:nbn:de:gbv:7-dariah-2015-7-2\" target=\"_blank\">Forschungsdaten in den (digitalen) Geisteswissenschaften<\/a> (2015) hat einmal mehr gezeigt, dass der Begriff der &#8222;Forschungsdaten&#8220; in den Geisteswissenschaften ein Fremdk\u00f6rper zu sein scheint und dass Bem\u00fchungen, ihm eine \u00e4hnlich gelagerte Pr\u00e4gnanz wie in den Natur- und Technikwissenschaften zu geben, bislang zumindest nicht in dem Ma\u00dfe erfolgreich waren, wie dies in wissenschaftspolitischen \u00c4u\u00dferungen oft unterstellt wird. Die von Geisteswissenschaftlern genutzten basalen Kategorien von Quelle und (Forschungs-)Literatur lassen sich nicht ohne weiteres als &#8222;Forschungsdaten&#8220; deuten. Die nicht zuletzt wegen dieser Sperrigkeit in den Blick genommene &#8222;Materialsammlung&#8220;, der &#8222;Kartei&#8220; bzw. &#8222;Datenbank&#8220; des oder der Forschenden, enth\u00e4lt zwar Daten, die man &#8222;Forschungsdaten&#8220; nennen k\u00f6nnte, ihr haftet aber meist der Charakter des Vorl\u00e4ufigen, des Unfertigen und auch Verg\u00e4nglichen an,\u00a0der deren Nachnutzbarkeit in Frage stellt. <a href=\"http:\/\/nbn-resolving.de\/urn:nbn:de:kobv:11-100212726\" target=\"_blank\">Sahle\/Kronenwett (2013) <\/a>sprechen daher zutreffend von <em>throughput<\/em> bzw. Zwischendaten (im Dreischritt von <em>input<\/em>, <em>throughput, output), <\/em>um das Transitorische von dieserlei Daten zu bezeichnen. Allerdings zeigt sich, dass &#8222;durch die Digitalisierung des Forschungsprozesses [&#8230;] die verschiedenen Arten von Forschungsdaten zu einem Kontinuum [verschmelzen], das von den Ausgangsdaten bis zu den Narrativen der Ergebnisse der Forschung alle Schritte der Verarbeitung umfasst&#8220; , so das auch dieser Begriff von Foschungsdaten zu verschwimmen scheint. Ebensowenig erfolgreich erweist sich der Versuch,\u00a0 sich \u00fcber den Datenbegriff einer Definition zu n\u00e4hern. \u00dcberlegungen in diesem Bereich haben bisher eigentlich nur gezeigt, dass unterschiedliche Dom\u00e4nen unterschiedliche Definitionen von Daten hervorbringen (s. z.B. <a href=\"http:\/\/nbn-resolving.de\/urn:nbn:de:kobv:11-100212657\">Voss 2013<\/a>). Was aber sind nun geisteswissenschaftliche Forschungsdaten? Sind sie lediglich eine Chim\u00e4re, ein von den Technik- und Naturwissenschaften geborgter Begriff? Ich denke, nicht, denn geisteswissenschaftliche Forschungsdaten sind l\u00e4ngst in die Praxis der Geisteswissenschaften eingekehrt, nur hat man bei den bisherigen Bem\u00fchungen um eine Defintion den Akzent noch nicht hinreichend auf das meines Erachtens wesentliche Charakteristikum gelegt. Zun\u00e4chst ist es eine einfach zu beobachtende Tatsache, dass das Aufkommen des Begriffs &#8222;Forschungsdaten&#8220; in den Geisteswissenschaften elementar mit der Digitalisierung oder dem digitalen Paradigma zusammenh\u00e4ngt und der Datenbegriff eigentlich auch nur vor diesem Hintergrund Sinn macht. <a href=\"http:\/\/web.dfc.unibo.it\/buzzetti\/dbuzzetti\/pubblicazioni\/kcl.pdf\" target=\"_blank\">Buzetti (2009)<\/a> hat dazu einen wichtigen Hinweis gegeben: <em>Data is the representation of information in a form that can be processed by a machine<\/em>. Es geht dabei weniger um die Entwicklung eines hinl\u00e4nglich genau bestimmten Daten- oder Informationsbegriffs, sondern um die Funktion der <em>Prozessierbarkeit<\/em>. Nur von dieser aus gewinnt der Begriff der geisteswissenschaftlichen Forschungsdaten Kontur. Sie sind nichts anderes als Quellen und Literatur oder auch Materialsammlungen, aber nicht als solche, sondern <em>\u00fcbersetzt<\/em> in eine maschinenlesbare Form. <em>Forschungs<\/em>daten sind sie darin, dass sie den Ausgangs- und, wenn er maschinenlesbar ist, auch Endpunkt eines Forschungsprozesses bilden. Ausgangs- und Endpunkt k\u00f6nnen sie aber nur sein, wenn sie einen definierten Status als akademisch verwertbares Produkt erreicht haben. Insofern sind Intermedi\u00e4rprodukte (&#8222;Zettelk\u00e4sten&#8220;) grunds\u00e4tzlich problematisch und die verhaltene Reaktion aus der geisteswissenschaftlichen community zur Frage der \u00f6ffentlichen Bereitstellung solcher Daten verdeutlich die bestehenden Bedenken. Solche <em>spin-off<\/em> Materialien bed\u00fcrfen daher meist selbst der Aufbereitung, um als Forschungsdaten in der Wissenschaft anerkannt zu werden. Sie verlieren darin aber ihren Charakter als Zwischendaten.<\/p>\n<p>Nun ist die Maschinenlesbarkeit allein noch keine hinreichende Bedingung f\u00fcr die Bestimmung von Forschungsdaten. Als <em>Forschungs<\/em>daten sind sie ein Relationsbegriff, sie sind Daten f\u00fcr etwas oder aus etwas und nur im Verh\u00e4ltnis zur Methode, die angewendet wird, signifikant. Sie m\u00fcssen daher nach einer bestimmten und nachvollziehbaren Regel angelegt sein. Mit anderen Worten, die Daten m\u00fcssen eine f\u00fcr einen Algorithmus verwertbare Struktur haben. Dieser Algorithmus wiederum ist Ausdruck der Methode, die auf die Daten angewendet wird, so dass das eine das andere bedingt. So gesehen, haben wir bei der Herstellung von Forschungsdaten stets einen Modellierungsschritt, in dem Gegenst\u00e4nde geisteswissenschaftlicher Forschung in einem Transformationsszenario nach Ma\u00dfgabe einer geisteswissenschaftlichen Fragestellung in Forschungsdaten umgewandelt werden. F\u00fcr eine vergleichende (auch automatisierte) Betrachtung von mittelalterlichen Illuminationen oder eine Bildsuche k\u00f6nnte das die Herstellung eines digitalen Faksimiles (<em>image<\/em>) sein, f\u00fcr eine Volltextsuche oder allgemeine lingusitische Textanaylse m\u00fcsste ein gedrucktes Dokument per OCR oder Transkription bearbeitet werden, die inhaltliche Auswertung und dynamische Visualisierung ben\u00f6tigt deskriptives Markup, die Analyse der Vernetzung von Personen braucht eine Aufbereitung als LOD von Personendaten, philosophische Konzepte m\u00fcssen per OWL modeliert werden, um automatisert Interdependenzen auswerten zu k\u00f6nnen, etc. Entscheidend ist die \u00dcbersetzung in eine maschinenlesbare und damit regelbasiert prozessierbare Form. Der in diesem Sinn verstandene generelle Begriff von &#8222;geisteswissenschaftlichen Forschungsdaten&#8220; bezeichnt, wenn er \u00fcber den Funktions- bzw. Relationsbegriff der Prozessierbarkeit definiert wird, daher nichts anders als die M\u00f6glichkeit digitalen Arbeitens \u00fcberhaupt. Man k\u00f6nnte auch sagen: Forschungsdaten sind die Bedingung der M\u00f6glichkeit der <em>Digital Humanities.<\/em><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Der von Peter Andorfer in den Dariah Working Papers erschienene Beitrag zu Forschungsdaten in den (digitalen) Geisteswissenschaften (2015) hat einmal mehr gezeigt, dass der Begriff der &#8222;Forschungsdaten&#8220; in den Geisteswissenschaften ein Fremdk\u00f6rper zu sein scheint und dass Bem\u00fchungen, ihm eine \u00e4hnlich gelagerte Pr\u00e4gnanz wie in den Natur- und Technikwissenschaften zu geben, bislang zumindest nicht in [&hellip;]<\/p>\n","protected":false},"author":41,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,23,5],"tags":[97],"class_list":["post-5995","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-forschung-methode","category-forschungsinfrastruktur","tag-forschungsdaten"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5995","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/41"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5995"}],"version-history":[{"count":13,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5995\/revisions"}],"predecessor-version":[{"id":6012,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5995\/revisions\/6012"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5995"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5995"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=5995"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}