{"id":9709,"date":"2018-04-10T11:21:11","date_gmt":"2018-04-10T09:21:11","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=9709"},"modified":"2018-06-05T15:04:09","modified_gmt":"2018-06-05T13:04:09","slug":"reproduzierbare-forschung-und-erweitertes-publizieren-mit-jupyter-notebooks","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=9709","title":{"rendered":"DARIAH-DE Grand Tour: Reproduzierbare Forschung und Erweitertes Publizieren mit Jupyter Notebooks"},"content":{"rendered":"<p>Digitale Methoden entwickeln sich zunehmend zur allt\u00e4glichen Praxis in den Geisteswissenschaften. Von der Erstellung einer Sammlung, \u00fcber Bildanalysen, Text-Annotierung, bis hin zu Netzwerk-Analysen f\u00fcr die Ideengeschichte, keiner dieser Bereiche wird heutzutage noch ohne Computer angegangen.<\/p>\n<p>Durch diese wachsende Bedeutung treten Themen, die urspr\u00fcnglich in der Software-Entwicklung angesiedelt waren, in den Fokus der Geisteswissenschaften. So stellt sich zum Beispiel die Frage der Nachhaltigkeit einer Software-Entwicklung f\u00fcr ein geisteswissenschaftliches Forschungsvorhaben oder welchen Best-Practice-Ma\u00dfst\u00e4be dabei verfolgt werden sollten.<\/p>\n<div id=\"attachment_9711\" style=\"width: 310px\" class=\"wp-caption alignright\"><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/04\/dariah-topic.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-9711\" class=\"wp-image-9711 size-medium\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/04\/dariah-topic-300x234.png\" alt=\"\" width=\"300\" height=\"234\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2018\/04\/dariah-topic-300x234.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/04\/dariah-topic.png 652w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-9711\" class=\"wp-caption-text\">Notebook zu <a href=\"https:\/\/github.com\/DARIAH-DE\/Topics\">DARIAH-DE Topics<\/a><\/p><\/div>\n<p>Eine relativ neue Entwicklung im Bereich der Software-Entwicklung ist das sogenannte \u201eliterate programming\u201c, wobei ein Programm eher narrativ mit starkem Fokus auf die Lesbarkeit des Codes geschrieben wird. Dieses Paradigma ist besonders f\u00fcr wissenschaftliche Fragestellungen in der Lehre interessant.<\/p>\n<p>Ein Vorreiter in diesem Gebiet sind <a href=\"http:\/\/jupyter.org\/\">Jupyter Notebooks<\/a>, oder kurz Notebooks, in denen neben Quellcode auch Markdown- oder Latex-Texte erlaubt sind. Die grundlegende Idee einer Notebook-Ver\u00f6ffentlichung ist die enge Verzahnung von Code, der meistens in Python, Julia, oder R geschrieben wurde, mit zugeh\u00f6rigen Erkl\u00e4rungen und Motivierungen. In einer interaktiven Ansicht k\u00f6nnen die LeserInnen des Textes dann zum einen den Code ausf\u00fchren, zum anderen diesen aber auch anpassen um beispielsweise statistische Behauptungen durch eine andere Parameterwahl zu \u00fcberpr\u00fcfen oder eine Berechnung mit anderen Start-Werten noch einmal auszuf\u00fchren. Ebenso kann eine Wissenschaftlerin die Erstellung eines Referenzdatensatzes mit allen Schritten der Daten-Akquise und Selektion sowie Bereinigung dokumentieren. Kombiniert mit \u00f6ffentlich verf\u00fcgbaren Forschungsdaten k\u00f6nnen Jupyter Notebooks einen wichtigen Beitrag zu reproduzierbarer Forschung leisten.<\/p>\n<p>Durch eine einfache Gliederungsstruktur mit Kapiteln oder Abs\u00e4tzen kann um einen Programm-Code eine vollwertige Ver\u00f6ffentlichung samt Bibliographie geschrieben werden. Bereits 2014 wurde dies durch einen <a href=\"https:\/\/www.nature.com\/news\/interactive-notebooks-sharing-the-code-1.16261\">Nature Artikel<\/a> beispielhaft gezeigt. Inzwischen wird die Umgebung zum Beispiel auch von Verlagen wie <a href=\"https:\/\/www.oreilly.com\/topics\/jupyter\">O\u2018Reilly<\/a> unterst\u00fctzt. Eine kuratierte Sammlung von Notebooks zu wissenschaftlichen Fragestellungen findet man zum Beispiel auf <a href=\"https:\/\/github.com\/jupyter\/jupyter\/wiki\/A-gallery-of-interesting-Jupyter-Notebooks#entire-books-or-other-large-collections-of-notebooks-on-a-topic\">Github<\/a>.<\/p>\n<p>F\u00fcr eine gr\u00f6\u00dfere Akzeptanz dieser Ver\u00f6ffentlichungsart sind zwei wichtige Aufgaben von Forschungsinfrastrukturen zu l\u00f6sen. Zum einen muss um die Unterst\u00fctzung von Jupyter Notebook-Publikationen geworben werden, bspw. m\u00fcssen eigene Darstellungsplattformen in den Einrichtungen f\u00fcr Wissenschaftler bereitgestellt werden. Als Vorreiter kann hier zum Beispiel die <a href=\"http:\/\/www.edition-topoi.org\">Edition-Topoi<\/a> genannt werden, die Notebooks (<a href=\"https:\/\/dx.doi.org\/10.17171\/2-2-281-1\">Beispiel<\/a>) bereits zitier-f\u00e4hig mit zugeh\u00f6rigen Daten publiziert. F\u00fcr das Erstellen solcher erweiterter Publikation,\u00a0 im Geiste des <a href=\"http:\/\/www.topoi.org\/news\/open-access-forschungsdaten-uneingeschrankt-und-zitierfahig-publizieren\/\">Open-Access<\/a>, sollten Forschungseinrichtungen f\u00fcr Mitglieder eine Editierumgebung f\u00fcr Notebooks anbieten, die das Teilen von Programm-Beispielen oder Datens\u00e4tzen erlaubt. Eindrucksvolle Beispiele hierf\u00fcr findet man zum Beispiel am <a href=\"https:\/\/swan.web.cern.ch\/content\/basic-examples\">Cern<\/a> oder bei der <a href=\"https:\/\/www.gwdg.de\/application-services\/jupyter\">GWDG<\/a>.<\/p>\n<div id=\"attachment_9710\" style=\"width: 310px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/04\/sundials-map.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-9710\" class=\"wp-image-9710 size-medium\" src=\"https:\/\/dhd-blog.org\/wp-content\/uploads\/2018\/04\/sundials-map-300x226.png\" alt=\"\" width=\"300\" height=\"226\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2018\/04\/sundials-map-300x226.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2018\/04\/sundials-map.png 735w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-9710\" class=\"wp-caption-text\">Notebook von Fundortverteilung von <a href=\"http:\/\/repository.edition-topoi.org\/collection\/BSDP\">Sonnenuhren<\/a>, (Sundial Distributions, Visualization, 2017, G. Gra\u00dfhoff, F. Kotschka, M. Vogl, Ancient Sundials, Edition Topoi)<\/p><\/div>\n<p>Ein Ansatz um den Einstieg in erweitertes Publizieren mit Jupyter Notebooks f\u00fcr Forschungseinrichtungen zu erleichtern, ist die Bereitstellung von \u201ePublikations-Baus\u00e4tzen\u201c f\u00fcr die Darstellung von Notebooks, zum Beispiel basierend auf Container-Technologie, durch Infrastruktur-Initiativen wie DARIAH-DE. Auf \u00e4hnliche Weise k\u00f6nnte ein \u201eEditier-Bausatz\u201c f\u00fcr WissenschaftlerInnen angeboten werden, der einen m\u00f6glichst barrierefreien Einstieg in das \u201eliterate programming\u201c erm\u00f6glicht.<\/p>\n<p>Ein im Rahmen einer <a href=\"https:\/\/www.mpiwg-berlin.mpg.de\/computational-history\">Max Planck Research Group<\/a> am <a href=\"https:\/\/www.mpiwg-berlin.mpg.de\/\">MPIWG<\/a> entwickelter Prototyp einer solchen Editier-Umgebung wird bei einem Workshop zu Jupyter Notebooks w\u00e4hrend der <a href=\"https:\/\/de.dariah.eu\/dariah-de-grand-tour-2018\">DARIAH-DE Grand Tour 2018<\/a> pr\u00e4sentiert und genutzt werden. Die Idee ist eine einfache Bereitstellung einer Editier-Umgebung f\u00fcr alle DARIAH-DE-NutzerInnen, authentifiziert \u00fcber die <a href=\"https:\/\/wiki.de.dariah.eu\/display\/publicde\/DARIAH+AAI+Documentation\">Dariah-AAI<\/a>, bei der automatisch eine Sammlung von Beispiel-Notebooks zur Verf\u00fcgung stehen wird, die als Grundlage f\u00fcr eigene Forschungsarbeiten dienen kann. Dabei werden typische Themen der DH abgedeckt sein, wie etwa das Laden von Webressourcen, mit anschlie\u00dfender Datenbank-Erstellung, Textklassifizierung, und Expertensuche mittels regul\u00e4rer Ausdr\u00fccke, Netzwerk-Erstellung und Analyse f\u00fcr Netzwerke historischer Pers\u00f6nlichkeiten oder das Visualisieren von Fundort-Datenbanken auf Landkarten.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Digitale Methoden entwickeln sich zunehmend zur allt\u00e4glichen Praxis in den Geisteswissenschaften. Von der Erstellung einer Sammlung, \u00fcber Bildanalysen, Text-Annotierung, bis hin zu Netzwerk-Analysen f\u00fcr die Ideengeschichte, keiner dieser Bereiche wird heutzutage noch ohne Computer angegangen. Durch diese wachsende Bedeutung treten Themen, die urspr\u00fcnglich in der Software-Entwicklung angesiedelt waren, in den Fokus der Geisteswissenschaften. So stellt [&hellip;]<\/p>\n","protected":false},"author":175,"featured_media":9566,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11,773,5,4],"tags":[204,85,97,495,805,806,112],"class_list":["post-9709","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-forschung","category-forschungsdaten","category-forschungsinfrastruktur","category-veranstaltungen","tag-dariah-de","tag-darmstadt","tag-forschungsdaten","tag-grand-tour","tag-jupyter","tag-notebook","tag-open-access"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/9709","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/175"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=9709"}],"version-history":[{"count":10,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/9709\/revisions"}],"predecessor-version":[{"id":9862,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/9709\/revisions\/9862"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/media\/9566"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=9709"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=9709"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=9709"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}