{"id":23034,"date":"2025-12-15T12:17:47","date_gmt":"2025-12-15T11:17:47","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=23034"},"modified":"2025-12-15T12:17:47","modified_gmt":"2025-12-15T11:17:47","slug":"harmonizing-language-data-warum-standards-fuer-nachhaltige-linguistische-ressourcen-jetzt-im-fokus-stehen","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=23034","title":{"rendered":"Harmonizing Language Data \u2013 Warum Standards f\u00fcr nachhaltige linguistische Ressourcen jetzt im Fokus stehen"},"content":{"rendered":"\n<p><em>Beitrag von Laura Herzberg (IDS Mannheim)<\/em><\/p>\n<p>Standards bilden die Grundlage nachhaltiger digitaler Forschung. Sie sorgen daf\u00fcr, dass Daten langfristig interpretierbar, auffindbar, archivierbar und interoperabel bleiben. Gerade in den Digital Humanities, wo komplexe sprachbasierte Ressourcen entstehen und verarbeitet werden, ist dieser Aspekt zentral: Ohne konsistente Standards drohen technische und konzeptionelle Verluste, die die Nachnutzbarkeit und wissenschaftliche Bedeutung von Daten gef\u00e4hrden.<\/p>\n<p>Vor diesem Hintergrund bietet der neue Sammelband<\/p>\n<p>Ba\u0144ski, Piotr; Heid, Ulrich; Herzberg, Laura (Hrsg.): <a href=\"https:\/\/www.degruyterbrill.com\/document\/doi\/10.1515\/9783112208212\/html\"><strong><em>Harmonizing Language Data: Standards for Linguistic Resources<\/em><\/strong><\/a>. De Gruyter, 2025. DOI: 10.1515\/9783112208212<\/p>\n<p>einen umfassenden \u00dcberblick \u00fcber zentrale Standards und Best Practices im Umgang mit linguistischen Forschungsdaten.<\/p>\n<p>Die Publikation ist Open Access verf\u00fcgbar und damit f\u00fcr die gesamte DH-Community frei zug\u00e4nglich.<\/p>\n<p><a href=\"https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-large wp-image-23035\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1-1024x683.jpg\" alt=\"\" width=\"900\" height=\"600\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1-1024x683.jpg 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1-300x200.jpg 300w, https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1-768x512.jpg 768w, https:\/\/dhd-blog.org\/app\/uploads\/2025\/12\/251204_1812_berlin-event-foto.de_ppw_275142-1-1536x1025.jpg 1536w\" sizes=\"auto, (max-width: 900px) 100vw, 900px\" \/><\/a><\/p>\n<p>Foto: Kameraperspektive, Sibylle Gabler (DIN), \u00a9 Peter-Paul Weiler<\/p>\n<p><strong>Themenfelder des Sammelbandes<\/strong><\/p>\n<p>Der Band adressiert eine Reihe von Bereichen, die f\u00fcr die Arbeit mit sprachbezogenen Daten in Forschungseinrichtungen, Infrastrukturprojekten und DH-Verb\u00fcnden im deutschsprachigen Raum hochrelevant sind:<\/p>\n<ul>\n<li><strong>Metadaten und Annotationen<br \/><\/strong>Metadaten strukturieren und kontextualisieren Forschungsdaten. Die Beitr\u00e4ge zeigen, wie sie die Auffindbarkeit, Dokumentation und langfristige Nachnutzbarkeit sichern, insbesondere bei komplexen mehrschichtigen Annotationen.<\/li>\n<li><strong>Langzeitarchivierung<br \/><\/strong>Digitale Forschungsdaten ben\u00f6tigen nachhaltige Speicher- und Formatstrategien. Der Band diskutiert, wie standardisierte Workflows und transparente Dokumentationspraktiken Daten \u00fcber viele Jahre hinweg nutzbar halten.<\/li>\n<li><strong>Audiovisuelle Ressourcen<br \/><\/strong>Gesprochene Sprache, audiovisuelle Materialien und multimodale Daten stellen besondere Anforderungen an Formate, Transkription und Annotation. Die Beitr\u00e4ge erl\u00e4utern etablierte Standards und praktische Herausforderungen in diesem Bereich.<\/li>\n<li><strong>Character Encoding und Sprachvarianten<br \/><\/strong>Konsistente Zeichenkodierung ist eine essenzielle Voraussetzung f\u00fcr die Arbeit mit Textdaten. Der Band erkl\u00e4rt typische Encoding-Probleme und zeigt, warum standardisierte Verfahren unverzichtbar f\u00fcr Interoperabilit\u00e4t sind.<\/li>\n<li><strong>Entity Linking<br \/><\/strong>Die semantische Vernetzung von Datenbest\u00e4nden gewinnt zunehmend an Bedeutung. Entity Linking kann heterogene Ressourcen miteinander verbinden und Recherchierbarkeit sowie Analysepotenzial erheblich verbessern.<\/li>\n<\/ul>\n<p><strong>Warum Standards heute wichtiger sind denn je<\/strong><\/p>\n<p>Mit dem Einsatz neuer Technologien, darunter KI-gest\u00fctzte Analyseverfahren und gro\u00dfe Sprachmodelle, entstehen neue Chancen, aber auch Herausforderungen. Die Digital Humanities folgen den Aspekten von Transparenz, Reproduzierbarkeit und Nachhaltigkeit. Standards sind hierf\u00fcr essenziell. Sie erm\u00f6glichen:<\/p>\n<ul>\n<li>nachvollziehbare Datenfl\u00fcsse,<\/li>\n<li>wiederholbare Prozesse,<\/li>\n<li>interoperable Werkzeuge,<\/li>\n<li>langfristig g\u00fcltige Forschungsdaten.<\/li>\n<\/ul>\n<p>\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\u00a0<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beitrag von Laura Herzberg (IDS Mannheim) Standards bilden die Grundlage nachhaltiger digitaler Forschung. Sie sorgen daf\u00fcr, dass Daten langfristig interpretierbar, auffindbar, archivierbar und interoperabel bleiben. Gerade in den Digital Humanities, wo komplexe sprachbasierte Ressourcen entstehen und verarbeitet werden, ist dieser Aspekt zentral: Ohne konsistente Standards drohen technische und konzeptionelle Verluste, die die Nachnutzbarkeit und wissenschaftliche [&hellip;]<\/p>\n","protected":false},"author":268,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[337,1253],"class_list":["post-23034","post","type-post","status-publish","format-standard","hentry","category-allgemein","tag-publikation","tag-standards"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/23034","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/268"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=23034"}],"version-history":[{"count":2,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/23034\/revisions"}],"predecessor-version":[{"id":23037,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/23034\/revisions\/23037"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=23034"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=23034"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=23034"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}