{"id":14457,"date":"2020-10-08T13:42:03","date_gmt":"2020-10-08T11:42:03","guid":{"rendered":"https:\/\/dhd-blog.org\/?p=14457"},"modified":"2020-10-08T14:56:43","modified_gmt":"2020-10-08T12:56:43","slug":"workshop-metadaten-analysieren-der-dhd-ag-zeitungen-zeitschriften","status":"publish","type":"post","link":"https:\/\/dhd-blog.org\/?p=14457","title":{"rendered":"Workshop \u201cMetadaten Analysieren\u201d der DHd-AG Zeitungen &amp; Zeitschriften"},"content":{"rendered":"\n<p><em>von Nanette Ri\u00dfler-Pipka, Harald Lordick und Torsten Roeder<\/em><\/p>\n\n\n\n<p>W\u00e4hrend viele Millionen Zeitungs- und Zeitschriftenseiten in Portalen wie Europeana oder der Deutschen Digitalen Bibliothek am Bildschirm lesbar sind, steht maschinenlesbarer Text nur in kleinen Mengen der Forschung zur Verf\u00fcgung. Schade, denkt man: Damit kann man ja nur begrenzt etwas anfangen. Doch all diese Digitalisate sind katalogisiert und manchmal sogar zu einem Anteil bis auf die Inhaltsverzeichnisse jeder Ausgabe, also bis auf Artikelebene erfasst. F\u00fcr Zeitungen und Zeitschriften sind diese zus\u00e4tzlichen Informationen schon durch die Struktur des Mediums besonders reichhaltig und wichtig.<\/p>\n\n\n\n<p>Diese Informationen nennen wir \u201cMetadaten\u201d.<a id=\"an01\" href=\"#fn01\">[1]<\/a> Und es ist gut, dass es sie gibt: Sie verraten uns zum einen in systematischer Form das, was aus den Digitalisaten explizit hervorgeht, wie etwa&nbsp; den Namen der Zeitung\/Zeitschrift, den Druckort, das Erscheinungsdatum. Zum anderen enthalten sie beispielsweise auch die Regelm\u00e4\u00dfigkeit des Erscheinens, die Anzahl der gescannten und der gedruckten Exemplare, die Autorinnen und Autoren sowie weitere Akteure, die Anzahl der Seiten und der Artikel oder die Sprache, in der die Artikel verfasst wurden. All dies kann viel Recherche erfordern. Speziellere Metadaten wie beispielsweise die Anzahl der Werbeanzeigen, das Geschlecht der Autorinnen und Autoren, die Anzahl der Bilder, \u00dcberschriften und Kunstwerke sind vielleicht auch gar nicht erfasst oder erfordern weitergehende Recherche. Dennoch: Was k\u00f6nnte man mit diesen Metadaten alles anfangen, welche Forschungsfragen behandeln? Und: Wie kommt man an diese Metadaten systematisch heran? Wie wertet man sie maschinell aus? Damit besch\u00e4ftigte sich der Workshop der <a rel=\"noreferrer noopener\" href=\"https:\/\/dhd-ag-zz.github.io\/\" target=\"_blank\">DHd-AG Zeitungen &amp; Zeitschriften<\/a>, welcher den Auftakt zu einer kleinen Reihe von Veranstaltungen zum wissenschaftlichen Arbeiten mit historischen digitalen Periodika bildete.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Im Vorfeld<\/h2>\n\n\n\n<p>Wir haben alle Interessierten bei Anmeldung zum Workshop darum gebeten, ihre Forschungsfragen anzugeben. Dabei kam bereits eine gro\u00dfe Vielfalt zusammen: von der Untersuchung der Akteure in bestimmten Zeitschriftentiteln bis hin zu in Zeit, Raum&nbsp; und Genre begrenzten Suchanfragen, um zun\u00e4chst einmal das relevante Korpus festzulegen. Die Komplexit\u00e4t der faszinierenden Forschungsfragen lie\u00df aber auch im Vorfeld bereits erkennen, dass wir vor allem grundlegende Werkzeuge mitgeben k\u00f6nnen, nicht aber im Workshop selbst zur Beantwortung gelangen w\u00fcrden. Intensive Hands-On-Passagen gaben jedoch Gelegenheit, bereits im Rahmen des Workshops Einzelfragen in kleinen Gruppen zu besprechen.<\/p>\n\n\n\n<p>Bei der Vorbereitung besch\u00e4ftigte uns nat\u00fcrlich auch die Frage, wie man bei mehr als zwanzig Teilnehmenden eine selbsterkl\u00e4rende und funktionierende Python-Umgebung einrichten kann. Am Ende stand allen Teilnehmenden ein individuelles, cloudbasiertes Jupyter-Notebook zur Verf\u00fcgung, in dem Code-Bl\u00f6cke durch ein Schritt-f\u00fcr-Schritt-Tutorial erkl\u00e4rt wurden und auch gleich durch praktische Programmierung ausprobiert werden konnten. Dadurch konnten wir fast unmittelbar nach der Vorstellungsrunde mit dem Coden beginnen.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-style-default\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"666\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-01-1024x666.png\" alt=\"\" class=\"wp-image-14460\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-01-1024x666.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-01-300x195.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-01-768x500.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-01.png 1296w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abb. 1: Screenshot aus dem Metadaten-Workshop der AG Zeitungen &amp; Zeitschriften<br>(Tutorial: Mark Hall, Andreas L\u00fcschow)<\/figcaption><\/figure>\n\n\n\n<p>Das Schritt-f\u00fcr-Schritt-Tutorial wurde von Mark Hall in Zusammenarbeit mit Andreas L\u00fcschow verfasst und erm\u00f6glichte den Teilnehmenden, w\u00e4hrend des Workshops im integrierten Jupyter Notebook \u2018mitzucoden\u2019 und sp\u00e4ter auch eigene Abfragen in der Programmiersprache Python zu schreiben.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Erster Tag: Wie komme ich an Metadaten?<\/h2>\n\n\n\n<p>Schon die Frage der ersten Einheit: \u201cWie komme ich an Metadaten?\u201d er\u00f6ffnete neue Perspektiven. Es gibt zwei Wege, die man gehen kann, um an das gew\u00fcnschte \u2018Metadaten\u2019-Korpus zu gelangen. Erstens, das manuelle Anlegen einer pers\u00f6nlichen Bibliographie (die zumeist aus Verweisen untereinander entsteht und mehr oder weniger kanonisch ist). Zweitens, das Verwenden einer vorliegenden Metadaten-Sammlung eines Daten- und Dienstanbieters. Hier ist man auf die vorgegebene Zusammensetzung der jeweiligen Sammlung beschr\u00e4nkt, hat daf\u00fcr den Vorteil eines klaren Kriteriums der Auswahl. Vermutlich kann man sich auch auf einen gewissen Qualit\u00e4tsstandard verlassen oder zumindest darauf hoffen. Im weiteren Verlauf des Workshops und der Analyse lernten wir, inwieweit man sich darauf verlassen kann: Wie alle Datensammlungen sind Metadaten niemals perfekt. Ein Beispiel ist die Landesangabe \u201cmul\u201d, die f\u00fcr \u201caus mehreren L\u00e4ndern\u201d steht und der Standarddefinition entspricht, aber f\u00fcr Au\u00dfenstehende schwierig zu interpretieren ist. Auch wird wenig mit kontrollierten Vokabularen gearbeitet, die abweichende Mehrfachbezeichnungen vereinheitlichen k\u00f6nnten.<\/p>\n\n\n\n<p>Wenn man Metadaten automatisiert beziehen m\u00f6chte, braucht man eine Schnittstelle. Manchmal werden diese Schnittstellen zumindest f\u00fcr Metadaten auch frei und offen auf der Webseite des Anbieters genannt, wie in dem im Workshop gew\u00e4hlten Beispiel: <a rel=\"noreferrer noopener\" href=\"https:\/\/www.digizeitschriften.de\/kontakt\/schnittstellen\/\" target=\"_blank\">https:\/\/www.digizeitschriften.de\/kontakt\/schnittstellen\/<\/a>. Oft sind Schnittstellen aber nicht offen sichtbar, sondern ihre Adressen m\u00fcssen entweder erfragt werden oder stecken hinter einer Anmeldeschranke. Wer besonders genau hinschaut, kann Metadaten-Schnittstellen unter Umst\u00e4nden auch anhand der URL im DFG-Viewer erraten.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"545\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02-1024x545.png\" alt=\"\" class=\"wp-image-14461\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02-1024x545.png 1024w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02-300x160.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02-768x409.png 768w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02-1536x818.png 1536w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-02.png 1600w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abb. 2: HTML-Ansicht einer OAI-PMH-XML-Ausgabe (www.digizeitschriften.de)<\/figcaption><\/figure>\n\n\n\n<p>Nun sind Schnittstellen in der Regel nicht gleichbedeutend mit Download-Buttons. Gleichzeitig steht f\u00fcr den Einstieg oder sporadische Nutzung keine Software zur Verf\u00fcgung, die niederschwellig das Harvesting von Metadaten z.B. via OAI-PMH-Schnittstelle erlauben w\u00fcrde. Manche Provider wie www.digizeitschriften.de bieten eine HTML-Ansicht ihrer OAI-PMH-XML-Ausgabe an. Dies ist \u00fcberaus hilfreich, um das Datenangebot zun\u00e4chst zu inspizieren: welche Metadatenformate, Datensets und Inhalte sind \u00fcberhaupt verf\u00fcgbar? Eine solche HTML-Ansicht erlaubt zwar prinzipiell auch die manuelle interaktive &#8218;Abfrage&#8216; der Schnittstelle. F\u00fcr die meisten Anwendungsf\u00e4lle in den Digital Humanities ist dies jedoch keine Option, und oft ist dieser &#8218;View&#8216; auch gar nicht verf\u00fcgbar. Entsprechend sinnvoll ist die von Mark Hall aus Anlass des Workshops neu entwickelte Python-Bibliothek \u201cPolymatheia\u201d (frei verf\u00fcgbar unter <a rel=\"noreferrer noopener\" href=\"https:\/\/polymatheia.readthedocs.io\" target=\"_blank\">https:\/\/polymatheia.readthedocs.io<\/a>). Diese kapselt die Komplexit\u00e4t der Interaktion mit den Metadatenschnittstellen (unter anderem werden OAI-PMH, Europeana, und demn\u00e4chst auch Search\/Retrieve via URL unterst\u00fctzt) und bietet Funktionalit\u00e4t zum Filtern und Transformieren der Metadaten. Die Metadaten k\u00f6nnen dann als JSON, XML, CSV, oder nach Pandas exportiert werden und stehen f\u00fcr die weitere Analyse bereit.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Zweiter Tag: Wie analysiere und visualisiere ich Metadaten?<\/h2>\n\n\n\n<p>Am darauffolgenden Tag wurde ausf\u00fchrlich \u00fcber statistische Verfahren und Visualisierungen gesprochen. Statistisches Grundlagenwissen ist enorm wichtig, wenn man aus den zahlreichen Metadatens\u00e4tzen \u2013 die leicht in die Tausende und auch Hunderttausende gehen k\u00f6nnen \u2013 Korrelationen zwischen Datenparametern wissenschaftlich fundiert nachweisen m\u00f6chte. Visualisierungen k\u00f6nnen indessen ein sehr hilfreiches Mittel sein, um einen \u00dcberblick \u00fcber ein (Meta)daten-Korpus zu gewinnen oder bestimmte Charakteristika auszumachen, helfen aber wiederum wenig als Aussagewert.<\/p>\n\n\n\n<figure class=\"wp-block-gallery columns-3 is-cropped wp-block-gallery-1 is-layout-flex wp-block-gallery-is-layout-flex\"><ul class=\"blocks-gallery-grid\"><li class=\"blocks-gallery-item\"><figure><img loading=\"lazy\" decoding=\"async\" width=\"402\" height=\"272\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03a.png\" alt=\"\" data-id=\"14462\" data-full-url=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03a.png\" data-link=\"https:\/\/dhd-blog.org\/?attachment_id=14462\" class=\"wp-image-14462\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03a.png 402w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03a-300x203.png 300w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03a-400x272.png 400w\" sizes=\"auto, (max-width: 402px) 100vw, 402px\" \/><\/figure><\/li><li class=\"blocks-gallery-item\"><figure><img loading=\"lazy\" decoding=\"async\" width=\"401\" height=\"273\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03b.png\" alt=\"\" data-id=\"14463\" data-full-url=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03b.png\" data-link=\"https:\/\/dhd-blog.org\/?attachment_id=14463\" class=\"wp-image-14463\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03b.png 401w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03b-300x204.png 300w\" sizes=\"auto, (max-width: 401px) 100vw, 401px\" \/><\/figure><\/li><li class=\"blocks-gallery-item\"><figure><img loading=\"lazy\" decoding=\"async\" width=\"426\" height=\"436\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03c.png\" alt=\"\" data-id=\"14464\" data-full-url=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03c.png\" data-link=\"https:\/\/dhd-blog.org\/?attachment_id=14464\" class=\"wp-image-14464\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03c.png 426w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03c-293x300.png 293w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03c-50x50.png 50w\" sizes=\"auto, (max-width: 426px) 100vw, 426px\" \/><\/figure><\/li><li class=\"blocks-gallery-item\"><figure><img loading=\"lazy\" decoding=\"async\" width=\"421\" height=\"272\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03d.png\" alt=\"\" data-id=\"14465\" data-full-url=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03d.png\" data-link=\"https:\/\/dhd-blog.org\/?attachment_id=14465\" class=\"wp-image-14465\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03d.png 421w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03d-300x194.png 300w\" sizes=\"auto, (max-width: 421px) 100vw, 421px\" \/><\/figure><\/li><li class=\"blocks-gallery-item\"><figure><img loading=\"lazy\" decoding=\"async\" width=\"403\" height=\"271\" src=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03e.png\" alt=\"\" data-id=\"14466\" data-full-url=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03e.png\" data-link=\"https:\/\/dhd-blog.org\/?attachment_id=14466\" class=\"wp-image-14466\" srcset=\"https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03e.png 403w, https:\/\/dhd-blog.org\/app\/uploads\/2020\/10\/dhdzz-metadaten2020-03e-300x202.png 300w\" sizes=\"auto, (max-width: 403px) 100vw, 403px\" \/><\/figure><\/li><\/ul><figcaption class=\"blocks-gallery-caption\">Abb. 3: a) Countplot b) Distributionplot c) Jointplot d) KDE Plot e) Violinplot<\/figcaption><\/figure>\n\n\n\n<p><br>In mehreren Breakout-Rooms (mit Big Blue Button sehr flexibel handhabbar) organisierten sich dann spontan verschiedene Gruppen nach Interessenlage: Ein Raum besch\u00e4ftigte sich mit der Struktur des METS\/MODS Metadatenschemas, w\u00e4hrend in einem anderen die Metadaten der Leopoldina-Zeitschrift <a rel=\"noreferrer noopener\" href=\"https:\/\/zs.thulb.uni-jena.de\/receive\/jportal_jpjournal_00001406\" target=\"_blank\">\u201cMiscellanea Curiosa\u201d<\/a> \u00fcber eine OAI-PMH-Schnittstelle geharvestet sowie ein intensiverer Blick auf die Metadaten der <a rel=\"noreferrer noopener\" href=\"https:\/\/sturm-edition.de\/\" target=\"_blank\">\u201cSTURM\u201d-Edition<\/a> (AdW Mainz) geworfen wurde; in einem weiteren Raum wurde diskutiert, wie spezifische Fragestellungen gel\u00f6st werden k\u00f6nnten. Eine Hilfe- und Selbsthilfegruppe f\u00fcr alle technischen Belange bildete sich in einem vierten Raum. Die Zeit in den Breakout-Rooms war hilfreich, um das Erlernte in der Praxis zu erproben und zu vertiefen, reichte aber absehbar nicht aus, um wissenschaftliche Ergebnisse hervorzubringen.<\/p>\n\n\n\n<p>Damit w\u00e4ren wir wieder bei den urspr\u00fcnglichen Fragestellungen der Teilnehmenden angekommen: Nachdem allen nun eine Art universeller Handwerkskasten zur Verf\u00fcgung steht (nebenbei haben wir praktisch sogar ein wenig Python gelernt!), geht es im Nachgang des Workshops an die wissenschaftliche Anwendung. Wichtiger als schnelle Antworten auf einzelne Fragestellungen erschien uns als Ergebnis der neue Blick auf Metadaten: Sie bilden ein vielf\u00e4ltiges Universum, dem man mit einigen Kniffen Geheimnisse entlocken kann, welche bei ihrer Erstellung im Einzelfall noch nicht erahnbar waren.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Fazit<\/h2>\n\n\n\n<p>Nat\u00fcrlich war der Workshop vor der Pandemie noch als Pr\u00e4senzveranstaltung geplant und wir haben uns bewusst entschlossen, die im Vergleich intensive Vorarbeit (welchen virtuellen Raum, aber auch welche L\u00f6sung f\u00fcr das Tutorial?) zu investieren. Zwar mussten wir auch bei der virtuellen Veranstaltung die Teilnehmerzahl beschr\u00e4nken, um Hands-On-Sessions zu erm\u00f6glichen, daf\u00fcr aber erh\u00f6ht sich die Nachnutzbarkeit: Denn die Videos stehen fortan&nbsp; als Online-Tutorial zur Verf\u00fcgung. Ferner besteht die M\u00f6glichkeit, bei entsprechendem Interesse den Workshop zu wiederholen.<\/p>\n\n\n\n<p>Gerade weil sich sehr viele Menschen au\u00dferhalb der DHd-AG Zeitungen &amp; Zeitschriften angemeldet haben, fehlte uns sehr die M\u00f6glichkeit, sich in der Pause oder beim gemeinsamen Abendessen n\u00e4her kennen zu lernen, weiter \u00fcber die individuellen Forschungsfragen zu fachsimpeln und das \u201cSocialising\u201d generell. Nat\u00fcrlich bevorzugte man in der Pause lieber einen Spaziergang in der realen Welt gegen\u00fcber Tele-Smalltalk am Bildschirm. Nichtsdestotrotz konnte die DHd-AG im Nachgang einen Mitgliederzuwachs verzeichnen \u2013 weitere sind immer willkommen (<a rel=\"noreferrer noopener\" href=\"https:\/\/dhd-ag-zz.github.io\/\" target=\"_blank\">https:\/\/dhd-ag-zz.github.io\/<\/a>).<\/p>\n\n\n\n<p>Es steht nun die Anwendung des \u201cHandwerkskastens\u201d im eigenen Projekt noch aus. Erst dort werden sich die T\u00fccken der gro\u00dfen Metadatensammlungen, die Inkonsistenzen und auch die L\u00fccken im Ged\u00e4chtnis zeigen: Wie konnte man in Python nochmal nach den drei Autorennamen im Metadaten-Set filtern? Umso besser, dass es nicht nur das nachlesbare Tutorial (<a rel=\"noreferrer noopener\" href=\"https:\/\/github.com\/mmh352\/metadata-tutorial\" target=\"_blank\">https:\/\/github.com\/mmh352\/metadata-tutorial<\/a>), sondern auch die Anleitung zur Einrichtung eines \u2018baugleichen\u2019 Jupyter-Notebooks auf dem heimischen Ger\u00e4t und ohne Cloudl\u00f6sung gibt.<\/p>\n\n\n\n<p>Willkommener Nebeneffekt eines solchen Workshops nach unserem Eindruck: Das gemeinsame Wissen \u00fcber verf\u00fcgbare Metadatenangebote w\u00e4chst. Es lohnt sich au\u00dferdem, Datenanbieter im Vorfeld hinsichtlich Verf\u00fcgbarkeit oder Details anzusprechen, zumal dies&nbsp; die Nachfrage seitens der Community betont und damit wiederum \u2013 zumindest perspektivisch \u2013 weitere Angebote f\u00f6rdert.<\/p>\n\n\n\n<p><em>Alle Infos zum Workshop k\u00f6nnen hier abgerufen werden:<\/em><br><a href=\"https:\/\/dhd-ag-zz.github.io\/workshops\/2020-09_metadata_analysis\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/dhd-ag-zz.github.io\/workshops\/2020-09_metadata_analysis<\/a><\/p>\n\n\n\n<hr class=\"wp-block-separator\" \/>\n\n\n\n<p><a id=\"fn01\" href=\"#an01\">[1]<\/a> Zur allgemeinen Definition von Metadaten: \u201cPerhaps a more useful, \u2018big picture\u2019 way of thinking about metadata is as the sum total of what one can say about any information object at any level of aggregation.\u201d (Anne J. Gilliland: \u201cSetting the Stage\u201d, in: Baca, Murtha, Hrsg. Introduction to Metadata. Third edition. Los Angeles: The Getty Research Institute, 2008\/2016, p. 2. <a rel=\"noreferrer noopener\" href=\"https:\/\/www.getty.edu\/publications\/intrometadata\/setting-the-stage\/\" target=\"_blank\">https:\/\/www.getty.edu\/publications\/intrometadata\/setting-the-stage\/<\/a>)<\/p>\n\n\n","protected":false},"excerpt":{"rendered":"<p>von Nanette Ri\u00dfler-Pipka, Harald Lordick und Torsten Roeder W\u00e4hrend viele Millionen Zeitungs- und Zeitschriftenseiten in Portalen wie Europeana oder der Deutschen Digitalen Bibliothek am Bildschirm lesbar sind, steht maschinenlesbarer Text nur in kleinen Mengen der Forschung zur Verf\u00fcgung. Schade, denkt man: Damit kann man ja nur begrenzt etwas anfangen. Doch all diese Digitalisate sind katalogisiert [&hellip;]<\/p>\n","protected":false},"author":10,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,4,1163],"tags":[1174,937,1175,356,1178,1176,95,1179,1177,206,941,169,804,98,237,1125,1124],"class_list":["post-14457","post","type-post","status-publish","format-standard","hentry","category-allgemein","category-veranstaltungen","category-webinar","tag-ag-zeitungen-zeitschriften","tag-analyse","tag-dhd-ags","tag-europeana","tag-json","tag-jupyter-notebook","tag-metadaten","tag-mets-mods","tag-oai-pmh","tag-python","tag-schnittstellen","tag-visualisierung","tag-webinar","tag-workshop","tag-xml","tag-zeitschriften","tag-zeitungen"],"_links":{"self":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14457","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/users\/10"}],"replies":[{"embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=14457"}],"version-history":[{"count":12,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14457\/revisions"}],"predecessor-version":[{"id":15094,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=\/wp\/v2\/posts\/14457\/revisions\/15094"}],"wp:attachment":[{"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=14457"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=14457"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/dhd-blog.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=14457"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}