{"id":15540,"date":"2021-04-22T10:30:00","date_gmt":"2021-04-22T08:30:00","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=15540"},"modified":"2021-04-22T10:45:53","modified_gmt":"2021-04-22T08:45:53","slug":"inhaltsbasierte-suche-in-lehrmaterialien","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=15540","title":{"rendered":"Inhaltsbasierte Suche in Lehrmaterialien"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">Der CLARIAH-DE Tutorial Finder<\/h2>\n\n\n\n<p>Im Rahmen von <a href=\"https:\/\/www.clariah.de\">CLARIAH-DE<\/a> entsteht mit dem <a href=\"https:\/\/teaching.clariah.de\">CLARIAH-DE Tutorial Finder<\/a> eine Suche \u00fcber geisteswissenschaftliche Lehrmaterialien, die an unterschiedlichen Stellen des Internets, wie Portalen, Internetseiten und Repositorien angeboten werden. Das wesentliche Ziel der Suchl\u00f6sung besteht darin, digital arbeitenden Geisteswissenschaftlerinnen und Geisteswissenschaftlern einen integrativen Zugang zu verteilten Schulungsmaterialien bereitzustellen und im Zuge dessen auch die Sichtbarkeit und Nachnutzbarkeit relevanter Materialien zu erh\u00f6hen.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"811\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/01-1024x811.png\" alt=\"\" class=\"wp-image-15543\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/01-1024x811.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/01-300x237.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/01-768x608.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/01.png 1219w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abbildung 1: CLARIAH-DE Tutorial Finder<\/figcaption><\/figure>\n\n\n\n<p>F\u00fcr die Registrierung, Anreicherung und Aufbereitung der derzeit mehrheitlich als Text und Video vorliegenden Materialien stehen die bereits in weiteren Kontexten erprobten CLARIAH-DE Tools der Collection Registry (CR) und des Data Modeling Environments (DME) zur Verf\u00fcgung [1]. Die schlussendliche Integration und Herstellung der Durchsuchbarkeit ist im Rahmen des Tutorial Finders durch eine spezifische Installation der <a href=\"https:\/\/de.dariah.eu\/web\/guest\/generische-suche\">DARIAH-DE Generic Search<\/a> realisiert.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Einbindung externer Ressourcen an den Tutorial Finder<\/h2>\n\n\n\n<p>Um die Schritte aufzuzeigen, die n\u00f6tig sind, um eine Sammlung in den Tutorial Finder zu integrieren, soll ein konkretes Anwendungsbeispiel dienen. Mit <a href=\"https:\/\/campus.dariah.eu\/resource\/dariah-pathfinder-to-data-management-best-practices-in-the-humanities\">DARIAH-Campus<\/a> wurde eine Plattform aus dem DARIAH Verbund gew\u00e4hlt, auf der geisteswissenschaftliche Lehr- und Lernmaterialien verf\u00fcgbar gemacht werden [2]. Die Daten liegen im Fall von DARIAH-Campus als unstrukturierte Textdateien vor, die jedoch im Markdown-Format annotiert sind.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"520\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02-1024x520.png\" alt=\"\" class=\"wp-image-15544\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02-1024x520.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02-300x152.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02-768x390.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02-1536x780.png 1536w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/02.png 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abbildung 2: Browserdarstellung einer Ressource in DARIAH-Campus<\/figcaption><\/figure>\n\n\n\n<p>Neben den Prim\u00e4rdaten der in DARIAH-Campus hinterlegten Texte k\u00f6nnen mit Hilfe einer gezielten Modellierung der Inhalte weitere, f\u00fcr die Suche bedeutende Informationen extrahiert werden. Darunter z\u00e4hlen unter anderem Metadaten, wie Autoren, Schlagworte und Zeitangaben, sprachlich unterschiedliche Bereiche und multimediale Bestandteile der Markdown-Dateien oder auch Verweise auf externe bzw. weiterf\u00fchrende Inhalte. Im Beispiel von DARIAH-Campus finden sich insbesondere Referenzen zu YouTube Videos, die im urspr\u00fcnglichen Artikel eingebettet sind. \u00dcber eine Anfrage an die <a href=\"https:\/\/developers.google.com\/youtube\/v3\">YouTube Data API<\/a> werden zus\u00e4tzliche Daten bereitgestellt, mit deren Hilfe der Tutorial Finder in die Lage versetzt wird, entsprechende Videos direkt bei den Suchergebnissen anzeigen zu k\u00f6nnen. Die n\u00f6tigen Schritte f\u00fcr die Verarbeitung derartiger Ressourcen mithilfe der CR und DME werden im Folgenden grob skizziert. Eine ausf\u00fchrliche Anleitung, die insbesondere auf die Details im Umgang mit Ressourcen aus Git-Repositories und die Modellierung von Inhalten n\u00e4her eingeht, wurde als <a href=\"http:\/\/nbn-resolving.org\/urn:nbn:de:gbv:7-dariah-2021-2-5\">DARIAH Working Paper<\/a> ver\u00f6ffentlicht.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Beschreibung der Daten und der Sammlung<\/h2>\n\n\n\n<p>Um die Zug\u00e4nglichkeit und Nachnutzbarkeit einer Sammlung und der beinhalteten Daten herzustellen, ist ein entsprechender Eintrag in der CR anzulegen. Im Sammlungseditor der CR werden die n\u00f6tigen Informationen eingetragen, die im Falle einer Sammlung wie DARIAH-Campus die URI, den Dateityp und die anzuwendenden Zugriffsmuster umfassen. Weitere Elemente wie den Branch des jeweiligen Git-Repositories, falls es sich bei der Sammlung um ein in Git gehostetes Repository handelt, oder das zu verwendende Datenmodell k\u00f6nnen hier ebenso angegeben werden.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"492\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03-1024x492.png\" alt=\"\" class=\"wp-image-15545\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03-1024x492.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03-300x144.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03-768x369.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03-1536x737.png 1536w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/03.png 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abbildung 3: Datenmodell von DARIAH-Campus in der DME<\/figcaption><\/figure>\n\n\n\n<p>Das Datenmodell spielt hierbei eine wichtige Rolle, da die in der DME verzeichneten Modelle es den weiteren Diensten in der CLARIAH-Infrastruktur, wie etwa dem Tutorial Finder, erlauben, sammlungs\u00fcbergreifend in den Daten zu suchen oder diese weiter zu verarbeiten. Im konkreten Fall von DARIAH-Campus wird das <a href=\"https:\/\/teaching.clariah.de\/dme\/model\/editor\/5f1d40316117b104a5fd3944\/\">mdx<\/a> (DARIAH-Campus) Datenmodell verwendet, welches durch die Anwendung von Grammatiken (z. B. <i>ParseText<\/i>) und Transformationsregeln (z. B. <i>ExtractMetadata<\/i>) strukturelle Regeln der Daten expliziert und semi-strukturierte Daten gewinnt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Interoperabilit\u00e4t und Integration von Daten<\/h2>\n\n\n\n<p>Die durch die Modellierung gewonnene Elementhierarchie f\u00fchrt zu einer angereicherten und strukturierten Repr\u00e4sentation von Daten, welche nun zur Herstellung von Mappings eingesetzt werden kann. F\u00fcr den im Beispiel modellierten Anwendungsfall des CLARIAH-DE Tutorial Finders besteht das derzeit gew\u00e4hlte Integrationsmodell (Facettierung der Suche, Filtern von Suchergebnissen, etc.) im <a href=\"https:\/\/schema.datacite.org\">DataCite Metadata Schema<\/a>, welches um eine M\u00f6glichkeit zur Einbettung von Volltexten erweitert wurde. Der Bildschirmausschnitt in Abbildung 4 zeigt eine \u00dcbersichtsansicht des Mappings des DARIAH-Campus Datenmodells auf das erweiterte <a href=\"https:\/\/teaching.clariah.de\/dme\/mapping\/editor\/5f2148346117b104a5fd3c02\/\">DataCite Datenmodell<\/a>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1600\" height=\"788\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04-1024x504.png\" alt=\"\" class=\"wp-image-15546\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04-1024x504.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04-300x148.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04-768x378.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04-1536x756.png 1536w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/04.png 1600w\" sizes=\"auto, (max-width: 1600px) 100vw, 1600px\" \/><figcaption>Abbildung 4: Darstellung des Mappings zweier Datenmodelle am Beispiel einer DARIAH-Campus Ressource<\/figcaption><\/figure>\n\n\n\n<p>Durch die Anwendung des Mappings auf Beispieldaten werden diese in das Zielformat \u00fcberf\u00fchrt. Abbildung 4 zeigt im rechten Bereich einen Ausschnitt der transformierten Daten im Zielformat.<br>Mit der Eintragung der Sammlung in der CR, der Modellierung der Daten und der Herstellung des Mappings stehen dem CLARIAH-DE Tutorial Finder alle Informationen zur Verf\u00fcgung, die f\u00fcr den Abruf, die Anreicherung, die Indexierung und die Integration der DARIAH-Campus Daten erforderlich sind. Abbildung 5 pr\u00e4sentiert die DARIAH-Campus Ressource, die \u00fcber den Tutorial Finder gesucht wurde und wie diese Daten hier dargestellt werden.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"504\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05-1024x504.png\" alt=\"\" class=\"wp-image-15547\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05-1024x504.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05-300x148.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05-768x378.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05-1536x756.png 1536w, https:\/\/dhd-blog.org\/app\/uploads\/2021\/03\/05.png 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abbildung 5: Darstellung der Suchergebnisse im Tutorial Finder, erneut am Beispiel von DARIAH-Campus<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Weiterf\u00fchrende Links und Kontakt<\/h2>\n\n\n\n<p>Eine ausf\u00fchrliche Anleitung zu der in diesem Blogpost beschriebenen Integration von Daten in die CLARIAH-DE Infrastruktur mittels der Collection Registry und dem Data Modeling Environment finden Sie in Form eines <a href=\"http:\/\/nbn-resolving.org\/urn:nbn:de:gbv:7-dariah-2021-2-5\">DARIAH Working Papers<\/a> [3]. Sollten Sie \u00fcber Lehrmaterialien verf\u00fcgen, die Sie gerne \u00fcber den Tutorial Finder zug\u00e4nglich machen wollen, z\u00f6gern Sie nicht, einen entsprechenden Eintrag in der CR anzulegen oder sich an den <a href=\"https:\/\/www.clariah.de\/support\">CLARIAH-DE Support<\/a> zu wenden. Dieser steht Ihnen auch bei Fragen gerne zur Verf\u00fcgung.<\/p>\n<p>&nbsp;<\/p>\n\n\n\n<hr class=\"wp-block-separator\" \/>\n\n\n\n<p>&nbsp;<\/p>\n<p>[1] Tobias Gradl, Andreas Henrich. &#8222;Die DARIAH-DE-F\u00f6derationsarchitektur \u2013 Datenintegration im Spannungsfeld forschungsspezifischer und dom\u00e4nen\u00fcbergreifender Anforderungen&#8220;. Bibliothek Forschung und Praxis Vol. 40 Nr. 2. S. 222-228, 2016. <a href=\"https:\/\/doi.org\/10.1515\/bfp-2016-0027\">https:\/\/doi.org\/10.1515\/bfp-2016-0027<\/a><\/p>\n<p>[2] Mehr Informationen zu DARIAH-Campus sind in diesem Blogpost beschrieben: <a href=\"https:\/\/dhd-blog.org\/?p=15439\">https:\/\/dhd-blog.org\/?p=15439<\/a><\/p>\n<p>[3] Tobias Gradl, Robin Jegan. &#8222;Nachnutzung Git-basierter Sammlungen im Rahmen der Infrastrukturdienste von CLARIAH-DE&#8220;. DARIAH-DE Working Papers Nr. 42. G\u00f6ttingen: DARIAH-DE, 2021. URN: <a href=\"http:\/\/nbn-resolving.org\/urn:nbn:de:gbv:7-dariah-2021-2-5\">urn:nbn:de:gbv:7-dariah-2021-2-5<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Der CLARIAH-DE Tutorial Finder Im Rahmen von CLARIAH-DE entsteht mit dem CLARIAH-DE Tutorial Finder eine Suche \u00fcber geisteswissenschaftliche Lehrmaterialien, die an unterschiedlichen Stellen des Internets, wie Portalen, Internetseiten und Repositorien angeboten werden. Das wesentliche Ziel der Suchl\u00f6sung besteht darin, digital arbeitenden Geisteswissenschaftlerinnen und Geisteswissenschaftlern einen integrativen Zugang zu verteilten Schulungsmaterialien bereitzustellen und im Zuge dessen [&hellip;]<\/p>\n","protected":false},"author":282,"featured_media":15543,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,773,5,37,1194],"tags":[933,831,204,1247,1249,1248],"class_list":["post-15540","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-allgemein","category-forschungsdaten","category-forschungsinfrastruktur","category-markup-languages","category-tool-service","tag-clariah-de","tag-collection-registry","tag-dariah-de","tag-data-modelling-environment","tag-lehrmaterialsuche","tag-tutorial-finder"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/15540","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/282"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=15540"}],"version-history":[{"count":14,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/15540\/revisions"}],"predecessor-version":[{"id":15705,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/15540\/revisions\/15705"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/media\/15543"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=15540"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=15540"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=15540"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}