{"id":13398,"date":"2020-03-26T15:03:59","date_gmt":"2020-03-26T14:03:59","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=13398"},"modified":"2020-05-28T07:50:38","modified_gmt":"2020-05-28T05:50:38","slug":"rueckblick-auf-den-sshoc-clariah-workshop-in-goettingen","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=13398","title":{"rendered":"R\u00fcckblick auf den SSHOC &#038; CLARIAH Workshop in G\u00f6ttingen"},"content":{"rendered":"\n<p><em>von Jonathan Geiger<\/em><\/p>\n<p>Unter dem Thema \u201cLinking Services and Data the Easy Way\u201d stand der Lunch-to-Lunch Workshop, der vom 12. bis zum 13. Dezember 2019 in G\u00f6ttingen in den R\u00e4umlichkeiten der <a href=\"https:\/\/www.gwdg.de\/de\">Gesellschaft f\u00fcr wissenschaftliche Datenverarbeitung mbH G\u00f6ttingen<\/a> (GWDG) stattfand. Initiiert wurde der Workshop von SSHOC und CLARIAH-DE und fasste thematisch insbesondere die Verkn\u00fcpfung von Webservices, Tools und Datenrepositorien \u00fcber das <a href=\"https:\/\/switchboard.clarin.eu\/\">Language Resource Switchboard<\/a> (LRS) als Br\u00fcckentechnologie ins Auge.<\/p>\n<p><a href=\"https:\/\/sshopencloud.eu\/\">SSHOC<\/a> (Social Sciences &amp; Humanities Open Cloud) ist ein EU-Projekt im Rahmen des Programms Horizon 2020, welches sich von Januar 2019 bis April 2022 der Aufgabe widmet die digitale Infrastrukturen der Geistes- und Sozialwissenschaften auf EU-Ebene auf eine neue Stufe zu heben. <a href=\"https:\/\/www.clariah.de\/\">CLARIAH-DE<\/a> hingegen ist das deutsche zweij\u00e4hrige Projekt mit einer Laufzeit bis M\u00e4rz 2021, in dem die beiden virtuellen Forschungsinfrastrukturen CLARIN-D und DARIAH-DE der Geistes-, Sozial- und Kulturwissenschaften in eine einzige Infrastruktur zusammengef\u00fchrt werden.<\/p>\n<p>Die Verkn\u00fcpfung von Linked Data und Webservices, insbesondere \u00fcber das LRS, nimmt sowohl bei SSHOC als auch bei CLARIAH-DE einen zentralen Stellenwert ein. Ziel des Workshops war daher, gemeinsam M\u00f6glichkeiten der Interoperabilisierung und der Verschaltung des Switchboards auszuloten sowie Werkzeuge zur priorisierten Integration zu identifizieren. Dem Switchboard kommt deshalb eine zentrale Rolle zu, weil dieser Webservice es als Br\u00fcckentechnologie erlaubt MIME-Types von zu verarbeitenden Dateien analysieren zu k\u00f6nnen und aufgrund dessen eine Vorschlagsliste mit solchen Tools an den User zur\u00fcckgibt, die die entsprechenden Datenstrukturen weiterverarbeiten k\u00f6nnen. Es handelt sich also um ein sogenanntes Data Broker-Tool. Werden beispielsweise XML-Daten in das Switchboard eingespielt, erkennt das Switchboard die Daten als XML-Daten und die zur\u00fcckgelieferte Ergebnisliste beinhaltet die Untermenge der insgesamt im Switchboard hinterlegten Tools, die XML prozessieren k\u00f6nnen, die dann auch direkt ausgew\u00e4hlt und f\u00fcr die weitere Datenverarbeitung angesteuert werden k\u00f6nnen.<\/p>\n<p>Die ca. 25 Teilnehmer stellten zu Beginn sich und die beiden zugrundeliegenden Projektkontexte (SSHOC und CLARIAH-DE) vor und betonten nochmal die zentrale Position, die das Switchboard in beiden Projekten einnimmt. F\u00fcr SSHOC stellt das Switchboard eine Schnittstelle dar, \u00fcber die Webservices in die SSH Cloud integriert werden k\u00f6nnen, zudem \u00fcbernimmt es die Funktion eines Gatekeepers, um im SSH Open Marketplace den Zugang zu Services und Daten zu schaffen. F\u00fcr CLARIAH-DE hingegen geht es prim\u00e4r um eine Struktur, die die Verstetigung der (insbesondere gro\u00dfen) Dienste und Werkzeuge aus CLARIN-D und DARIAH-DE gew\u00e4hrleisten kann. Hierbei spielen auch die Beschreibungen der Dienste (sowohl in einer menschenlesbaren Form, z. B. der DARIAH-DE Service Lifecycle, als auch in einer maschinenlesbaren Form, z. B. im JSON-Format) eine wichtige Rolle.<\/p>\n<p>Die St\u00e4rken des Switchboards liegen f\u00fcr den Nutzer insbesondere in der M\u00f6glichkeit eines simplen und zentralen Zugangspunktes zu einer F\u00fclle von Tools und Services und in der Daten-basierten Zugangsform. F\u00fcr Anbieter bietet es eine einfache M\u00f6glichkeit verschiedene Infrastrukturen und Werkzeuge zusammenzuschlie\u00dfen, zudem ist es leicht skalierbar und durch die modulare Struktur leicht zu warten und anzupassen. Weiterhin k\u00f6nnen Tools \u00fcber diesen Weg auch leichter sichtbar gemacht und getestet werden.<\/p>\n<p>Herausforderungen mit denen sich das Switchboard aktuell noch konfrontiert sieht, liegen einerseits in einem Ausbau des Datenimportmoduls. Es findet keine Validierung von XML-Daten statt und es k\u00f6nnen noch nicht unterschiedliche XML-Dialekte (z. B. TEI und Derivate) als solche erkannt werden. Zudem k\u00f6nnen keine Kollektionen eingespielt werden und auch Daten mit mehreren Sprachen werden noch nicht als solche erkannt. Andererseits liegt noch viel Potential in einer Semantisierung der Beschreibungsdaten der einzelnen im Switchboard integrierten Services und Werkzeuge: Eine Auszeichnung mit <a href=\"http:\/\/tadirah.dariah.eu\/vocab\/index.php\">TaDiRAH<\/a> steht noch aus, ebenso eine intensivere Ann\u00e4herung der Werkzeugbeschreibungen an die Semantiken von LOD, z. B. \u00fcber die Anreicherung mit kontrollierten Vokabularen. Zudem steht noch in Frage, wie Tools integriert werden k\u00f6nnen, die eine lokale Installation erfordern oder gesch\u00fctzt sind und auch die Frage nach den Privacy- und Security-Aspekten der integrierten Tools ist noch ungekl\u00e4rt. Des weiteren muss noch eine Antwort gefunden werden auf die Frage, wie die kontinuierliche Erreichbarkeit und Funktionalit\u00e4t der Tools aufrechterhalten oder zumindest deren funktionaler Status im Switchboard aktuell gehalten werden kann, um f\u00fcr maximale Transparenz zur Verbesserung der Usability zu sorgen.<\/p>\n<p>Gemeinsam von SSHOC und CLARIAH-DE geplant ist f\u00fcr das Switchboard, dass es in noch weitere Servicekataloge integriert und die Funktionen, insbesondere was den Datenimport betrifft ausgebaut werden sollen. Zudem soll das Portfolio der integrierten Services und Werkzeuge erweitert und Workflows, z. B. zur niedrigschwelligen Kontribution weiterer Webservices etabliert werden. Die M\u00f6glichkeit Services f\u00fcr OCR, Visualisierungen, Bildverarbeitung und Metadatenkonversion zu integrieren, soll gepr\u00fcft werden. Zu diskutieren ist weiterhin, in welcher Form das LR Switchboard k\u00fcnftig verwaltet werden soll (zentralisiert, hierarchisch oder flach f\u00f6deralisiert usw.) und wie eng die hier hintergr\u00fcndig verschalteten Infrastrukturen zusammengebracht werden sollen.<\/p>\n<p>Im Anschluss wurden verschiedene konkrete Beispiel pr\u00e4sentiert und diskutiert, wie etwa die DARIAH Datenf\u00f6derationsarchitektur (DFA), das Cosmotool, der DKPro Wrapper, das T\u00fcbingen Archive of Language Resources (TALAR) und viele weitere mehr, die in das Switchboard integriert oder daran angeschlossen werden k\u00f6nnen. Im <a href=\"https:\/\/vlo.clarin.eu\/;jsessionid=262CA05C987A2C9590F9368AD00CFB5A?0\">CLARIN Virtual Language Observatory<\/a> (VLO) k\u00f6nnen Datensets beispielsweise direkt an die API des Switchboards gesendet und dort weiterverarbeitet werden, \u00e4hnliches ist auch bereits bei TALAR m\u00f6glich. Eingehend diskutiert wurden die M\u00f6glichkeiten eine derartige Exportfunktion auch im TextGrid-Lab bzw. -Rep einzurichten.<\/p>\n<p>Zum Ende des Workshops hin wurden denkbare Switchboard Extensions vorgestellt und reflektiert. Es stellt sich die Frage, nach welchen Kriterien k\u00fcnftige Erweiterungen und Weiterentwicklungen priorisiert werden sollen \u2013 steht dabei die N\u00fctzlichkeit f\u00fcr den Nutzer im Vordergrund? Was bedeutet in diesem Fall \u201cN\u00fctzlichkeit\u201d und welche Nutzer nimmt man hierbei in den Blick? Welche Rolle spielt die Implementier- und Wartbarkeit der Extensions? Oder auch die Breite der Unterst\u00fctzung durch angeschlossene Tools und Repositorien? Grunds\u00e4tzlich sind verschiedene Arten von Extensions f\u00fcr das Switchboard denkbar: Neben Visualisierungsm\u00f6glichkeiten (beispielsweise von Content Snippets) und Popups sind Formen des \u201cData Dowsings\u201d (d. h. eine effizientere Form des Datenzugangs) denkbar. Weiterhin k\u00f6nnten Browser-Extensions entwickelt oder Datenkonvertierungsm\u00f6glichkeiten in das Switchboard selbst implementiert werden. M\u00f6glich w\u00e4ren \u00fcberdies Extensions, die die Metadaten der eingespeisten Daten weiterverarbeiten k\u00f6nnen oder solche, mit denen Batch Processing m\u00f6glich w\u00fcrde, was den Spielraum der Verwendungsm\u00f6glichkeiten massiv vergr\u00f6\u00dferte.<\/p>\n<p>Zusammenfassend l\u00e4sst sich festhalten, dass der zwei-Tages-Workshop in G\u00f6ttingen die beiden auf dem aktuell \u2013 nicht zuletzt vor dem Hintergrund der NFDI \u2013 stark im Wandel begriffenen Gebiet der technischen Infrastrukturen der Geistes-, Sozial- und Kulturwissenschaften einschl\u00e4gigen Akteure SSHOC und CLARIAH-DE zusammengebracht hat und gemeinsame Interessen und Entwicklungsm\u00f6glichkeiten insbesondere am Kondensationspunkt des Data Broking-Tools LR Switchboard artikuliert und ausgetauscht werden konnten. Gemeinsam wurden die aktuellen Vorz\u00fcge und Potenziale dieser Br\u00fcckentechnologie ausgelotet, sowie Best Practice-Beispiele f\u00fcr die Integration von fachspezifischen Werkzeugen, Services und Datenrepositorien ausgetauscht. Auch wurden die weiteren Entwicklungsplanungen eng abgestimmt.<\/p>\n<p>Die Atmosph\u00e4re war durchweg produktiv, insbesondere auch abseits des eng strukturierten Ablaufplans voller Pr\u00e4sentationen, Demonstrationen und Diskussionen. Der Workshop insgesamt spiegelte dabei in seinem Charakter der disziplin\u00fcbergreifenden aber dennoch gemeinsamen Interessen, des heterogenen Inputs und dem produktiven Ausarbeiten von weiteren Arbeitsm\u00f6glichkeiten auf originelle Art und Weise die Rolle und Bedeutung des Switchboards selbst wieder.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>von Jonathan Geiger Unter dem Thema \u201cLinking Services and Data the Easy Way\u201d stand der Lunch-to-Lunch Workshop, der vom 12. bis zum 13. Dezember 2019 in G\u00f6ttingen in den R\u00e4umlichkeiten der Gesellschaft f\u00fcr wissenschaftliche Datenverarbeitung mbH G\u00f6ttingen (GWDG) stattfand. Initiiert wurde der Workshop von SSHOC und CLARIAH-DE und fasste thematisch insbesondere die Verkn\u00fcpfung von Webservices, [&hellip;]<\/p>\n","protected":false},"author":171,"featured_media":13561,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,103,11,4],"tags":[],"class_list":["post-13398","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-allgemein","category-community","category-forschung","category-veranstaltungen"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13398","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/171"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=13398"}],"version-history":[{"count":3,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13398\/revisions"}],"predecessor-version":[{"id":13402,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/13398\/revisions\/13402"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/media\/13561"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=13398"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=13398"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=13398"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}