{"id":5533,"date":"2015-08-12T10:42:00","date_gmt":"2015-08-12T08:42:00","guid":{"rendered":"http:\/\/dhd-blog.org\/?p=5533"},"modified":"2015-08-12T22:37:17","modified_gmt":"2015-08-12T20:37:17","slug":"workshop-annotating-in-the-sphere-of-dariah-de","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=5533","title":{"rendered":"Workshop &#8222;Annotating in the Sphere of DARIAH-DE&#8220;"},"content":{"rendered":"<p><em>von <a href=\"https:\/\/twitter.com\/RuthReiche\">Ruth Reiche<\/a>, <a href=\"https:\/\/twitter.com\/luiseborek\">Luise Borek<\/a> und <a href=\"https:\/\/twitter.com\/MimoBender\">Michael Bender<\/a><\/em><\/p>\n<p>Am 23. und 24. Juli 2015 haben sich Mitarbeiterinnen und Mitarbeiter aus DARIAH-DE mit ihren Kollegen und Kolleginnen aus verschiedenen kooperierenden Projekten am Institut f\u00fcr Sprach- und Literaturwissenschaft an der Technischen Universit\u00e4t Darmstadt zu einer <a href=\"https:\/\/dev2.dariah.eu\/wiki\/pages\/viewpage.action?pageId=34346385\">Diskussionsrunde<\/a> zusammengefunden, um sich \u00fcber Methodiken und Annotationsverfahren auszutauschen.<\/p>\n<p>Im Projekt <i>ePoetics<\/i> werden literaturtheoretische Schriften digitalisiert, annotiert und analysiert. Bei den Annotationsgegenst\u00e4nden handelt es sich um \u201aLehren der Dichtkunst\u2018, aber nicht im Sinne von normativen Regelpoetiken. Konkret umfasst das Corpus 20 Poetiken von 1770-1960, in denen literaturtheoretisches Wissen diskursiv verhandelt wird. Aktuell im Mittelpunkt steht der Begriff der Metapher. Problemstellungen f\u00fcr die digitale Annotation mit dem Ziel der computergest\u00fctzten Auswertbarkeit liegen bei solchen Texten auf mehreren Ebenen vor: Das jeweilige Metaphernverst\u00e4ndnis muss differenziert erschlossen und die Komponenten der Begriffsbestimmung m\u00fcssen trennscharf kategorisiert werden k\u00f6nnen. Eine eindeutige Zuordnung zu Ans\u00e4tzen bzw. Denkschulen der antiken Rhetorik soll erzielt und Bez\u00fcge zu anderen Poetiken sollen erfasst werden. Beispiele aus der Prim\u00e4rliteratur sind eindeutig den jeweiligen theoretischen Aspekten zuzuordnen. Und schlie\u00dflich m\u00fcssen die Textebenen und Referenzstrukturen der Poetik explizit gemacht werden \u2013 also wo der Autor selbst theoretisiert, wo zitiert oder paraphrasiert wird, inwiefern dies kenntlich gemacht wird oder nicht und wo vom urspr\u00fcnglichen Text abgewichen wird. Dies wird durch die Annotation nach einem komplexen Schema umgesetzt. Die Annotationen werden einerseits in TEI-konformen XML-Dateien publiziert, andererseits aber auch als Grundlage von computergest\u00fctzten Analysen und Visualisierungen genutzt.<\/p>\n<p>Auch im Graduiertenkolleg <i>Natur &amp; Staat<\/i> geht es um die Metapher \u2013 genauer gesagt um \u201eMetaphernannotation in (popul\u00e4r-)wissenschaftlichen Texten Anfang des 20. Jahrhunderts\u201c, so der Titel des Impulsvortrags. Ausgangspunkt f\u00fcr die Annotation von Metaphern in diesen textuellen Gegenst\u00e4nden der Annotation sind Metapherntheorien \u2013 z.B. nach Lakoff\/Johnson, Max Black und Petra Gehring. Als Annotationswerkzeug wird <a href=\"https:\/\/www.ukp.tu-darmstadt.de\/software\/webanno\/\">WebAnno<\/a> genutzt, eine Webanwendung f\u00fcr mehrere Benutzer. Die unterschiedlichen theoretischen Modelle bedingen dabei unterschiedliche Metaphernannotationen auf verschiedenen Ebenen. Es werden Text-Abschnitte annotiert, die Metaphern-Teile darstellen, sowie die Relationen zwischen diesen Teilen (z.B. zwischen Source und Target, Bild-Spender und Bild-Empf\u00e4nger). Die Annotationen sollen als Trainingsdaten f\u00fcr einen Classifier genutzt werden, der automatisch Metaphern erkennen soll.<\/p>\n<p>Hinter den Briefwechseln des Projekts <i>Vernetzte Korrespondenzen<\/i> verbirgt sich nicht die Korrespondenz einiger Weniger untereinander, vielmehr besteht das Corpus aus vielen Briefen unterschiedlichster Urheber, die an eine Vielzahl von Adressaten gerichtet sind. Verbindendes Element ist hierbei das Exil, das spezielle Herausforderungen f\u00fcr das Annotieren mit sich bringt. Das Anreichern mit Geokoordinaten, Normdaten zu Personen, ihren Berufen oder Konfessionen und bibliografischen Angaben ist h\u00e4ufig nur mit gro\u00dfem Recherche-Aufwand zu realisieren. Doch sind diese oft fragmentarischen Informationen h\u00e4ufig nicht ausreichend, um in bestehende Normdaten aufgenommen zu werden. Die aus dem Projekt heraus formulierten Anforderungen bildeten die Diskussionsgrundlage f\u00fcr das Erfassen einer \u201aWunschliste&#8216;, in der m\u00f6gliche Services (z.B. Schnittstellen) aufgez\u00e4hlt werden, mit denen eine Forschungsinfrastruktur Projekte bei ihren Annotationsvorhaben unterst\u00fctzen kann.<\/p>\n<p>In <i>Relationen im Raum<\/i> geht es um Bildannotation, genauer um die Visualisierung von Informationen auf Karten und Lagepl\u00e4nen. Datengrundlage sind u.a. die in der epigraphischen Datenbank <i>epidat<\/i> des Steinheim Instituts edierten rund 25 000 j\u00fcdischen Grabmale. Der Topographie-Visualizer erm\u00f6glicht hierbei Annotationen zu topographischen Strukturen. Neben der konkreten Lage eines Grabsteins wird zudem eine Vielzahl von Merkmalen erfasst, deren Zusammenspiel komplexe Analysen erm\u00f6glicht. So l\u00e4sst sich z.B. die Form erfasster Grabsteine mit der jeweiligen Datierung in Beziehung setzen, so dass verschiedene \u201aModen&#8216; ablesbar werden.<\/p>\n<p><i>SemToNotes<\/i>\u00a0\u2013 kurz f\u00fcr <i>Semantic Topological Notes<\/i>\u00a0\u2013 ist eine Anwendung, die im DARIAH-DE Cluster 6 <i>Fachwissenschaftliche Dienste<\/i> entwickelt wird. Es handelt sich hierbei um ein Annotations-\u00a0und Retrievalwerkzeug zur Untersuchung von r\u00e4umlich-topologischen Beziehungen zwischen semantisch aufgeladenen Teilfl\u00e4chen eines Bildes, d.h. zur Untersuchung der r\u00e4umlichen Komposition eines Bildes. Dies geschieht, indem Teilfl\u00e4chen eines Bildes mit einem graphischen Editor durch Polygone markiert werden. Der Clou einer solchen nicht-textuellen Annotation besteht darin, dass die Beziehungen zwischen markierten Teilfl\u00e4chen berechnet werden k\u00f6nnen, z.B. welche Schnittstellen bestehen oder in welchem Winkel zwei Linien kreuzen. Eine derartige Funktionalit\u00e4t ist auch f\u00fcr <i>eCodicology<\/i> von Relevanz, das sich daher in einer engen Koopertaion mit <i>SemToNotes<\/i> befindet.<\/p>\n<p>Das Projekt<i> eCodicology<\/i> nutzt den Fundus des digitalisierten Bestandes von rund 500 mittelalterlichen Handschriften aus der Benediktinerabtei St. Matthias in Trier. Es werden Algorithmen entwickelt, die Layoutelemente der insgesamt rund 170 000 Einzelbilder automatisch erkennen und in den Metadaten der Handschriftendigitalisate hinterlegen. Anhand von Digitalisaten k\u00f6nnen also physikalische Merkmale erfasst werden, beispielsweise metrische Daten wie Blattgr\u00f6\u00dfe oder Gr\u00f6\u00dfe des Schrift- und Bildraums. Die vorhandenen bibliographischen Metadaten werden auf diese Weise um Zusatzinformationen zu den \u00e4u\u00dferen Merkmalen der Handschriftenseiten erweitert. Eine statistische und qualitative Auswertung dieser Annotationen erlaubt schlie\u00dflich die Analyse einer gro\u00dfen Zahl von Handschriftenseiten auf quasi-empirischer Basis, durch die der \u201asubjektive&#8216; Blick des Kodikologen \u201aobjektiviert&#8216; werden kann.<\/p>\n<p>Wie k\u00f6nnen wir als Geisteswissenschaftler annotieren? Eine M\u00f6glichkeit des digitalen Notierens besteht im Annotieren von PDFs oder Websites \u2013 in Analogie zu schnellen Randbemerkungen auf einer Buchseite. Dies geht z.B. mit <a href=\"http:\/\/annotatorjs.org\/\">Annotator<\/a>, einer frei verf\u00fcgbaren Javascript-Bibliothek. Auch fremde und statische Websites k\u00f6nnen so dynamisch in den eigenen Forschungsprozess eingebunden werden\u00a0\u2013 ein Potential des Digitalen, das zurzeit bei Weitem nicht ausgesch\u00f6pft wird. Web-Annotationen bilden eine Interoperabilit\u00e4tsschicht, bei der eine Annotation im Idealfall auf mehrere Targets zielt und von anderen verfolgt und nachgenutzt werden kann. Eine infrastrukturelle Herausforderung hierbei besteht in der Qualit\u00e4tssicherung der Annotationen, die \u00fcber eine AAI gesteuert werden sollte, um die Annotationen nach verschiedenen Aspekten zu filtern.<\/p>\n<p>Die verschiedenen Zug\u00e4nge und unterschiedlichen Praktiken, die im Workshop unter dem Annotationsbegriff subsumiert wurden, teilen insbesondere die Anforderung, dass zuverl\u00e4ssige und zentral verf\u00fcgbare Daten gebraucht werden, die den Ausgangspunkt f\u00fcr jede digital unterst\u00fctzte Forschungst\u00e4tigkeit stellen. Dies kann so etwas wie einen optimierten Scanprozess (Umgang mit Fragmenten einer Buchseite, Farbskala etc.) betreffen, sich aber auch in dem Bed\u00fcrfnis \u00e4u\u00dfern, dass bessere Schnittstellen vorhanden sein sollten, die einen Austausch und Erhalt von Daten erleichtern, z.B. das Einpflegen von in Projekten gewonnenen Personendaten in die Gemeinsame Normdatei (GND). Die Ergebnisse der Diskussion zeigen, dass wir auf dem richtigen Weg sind: Ihn konsequent weiterzuverfolgen erfordert die Unterst\u00fctzung durch eine Forschungsinfrastruktur und neben dem zweifelsohne vorhandenen Bedarf einen aktiven Kreis von Anwenderinnen und Anwendern.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>von Ruth Reiche, Luise Borek und Michael Bender Am 23. und 24. Juli 2015 haben sich Mitarbeiterinnen und Mitarbeiter aus DARIAH-DE mit ihren Kollegen und Kolleginnen aus verschiedenen kooperierenden Projekten am Institut f\u00fcr Sprach- und Literaturwissenschaft an der Technischen Universit\u00e4t Darmstadt zu einer Diskussionsrunde zusammengefunden, um sich \u00fcber Methodiken und Annotationsverfahren auszutauschen. Im Projekt ePoetics [&hellip;]<\/p>\n","protected":false},"author":8,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[],"class_list":["post-5533","post","type-post","status-publish","format-standard","hentry","category-veranstaltungen"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5533","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=5533"}],"version-history":[{"count":5,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5533\/revisions"}],"predecessor-version":[{"id":5548,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/5533\/revisions\/5548"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=5533"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=5533"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=5533"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}