Was ist ein Modell und wozu brauchen wir es?

5 Veröffentlicht von Ramona Roller am

Über interdisziplinäre Missverständnisse auf der DHd 2020

Modelle sind mathematische Formeln, mithilfe derer ich Zusammenhänge in meinen Daten testen kann. Mit diesem einfachen Modellbegriff bin ich als quantitative Sozialwissenschaftlerin ohne große Kontroversen gross geworden. Bis zur diesjährigen DHd 2020, der 7. Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum.

Die Konferenz beginnt mit zweitägigen Praxis-Sessions, bei denen ich den Workshop „Bias in Datensätzen und Machine Learning Modellen“ besuche. Wir testen Null-Hypothesen mit statistischen Modellen und alternative Hypothesen mithilfe von Simulationen in berechnenden (computational) Modellen. Die Modelle sind mathematisch formalisiert und passen daher wunderbar zu meinem eigenen Modellbegriff. Ich bleibe in meiner Komfortzone.

In der Pause komme ich mit Teilnehmenden anderer Workshops ins Gespräch. Plötzlich fallen Sätze wie: „Wir modellieren unsere Daten mit TEI.“, oder „Unser Modell ist eine neo4j Datenbank.“
„Annotationsstandards und Datenbanken sind doch keine Modelle.“, denke ich mir, „Wo sind denn da die Berechnungen?“. Und vor allem: „Wo sind die Forschungsfragen aufgrund derer wir bestimmte Berechnungen durchführen und andere sein lassen?“. Bei mir herrscht leichte Verwirrung.

Am Dienstag Abend sitze ich im Heinz Nixdorf MuseumsForum und lausche Julia Flanders‘ Keynote Vortrag über die Erstellung von Modellen in den Digital Humanities (DHs). Und plötzlich fällt der Groschen. Kann es sein, dass wir aneinander vorbei reden? Dass wir „Modell“ unterschiedlich definieren? Für mich ist ein Modell ein mathematisches Modell. Für Julia Flanders und viele andere DHd-ler hingegen scheint es ein Datenmodell zu sein. Das heißt, Standards zur Datenvorverarbeitung (z.B. Annotation) und Repräsentation (Datenbank).

Obwohl mein Missverständnis aus der Welt geschafft ist, stimmen mich viele Vorträge in den folgenden Tagen nachdenklich. Ich habe den Eindruck, dass der Erstellung von Modellen sehr viel Zeit und Ressourcen gewidmet werden, die Beantwortung von inhaltlichen Forschungsfragen jedoch in den Hintergrund rückt. Dabei sind es doch genau jene inhaltlichen Zusammenhänge, für die wir uns als WissenschaftlerInnen interessieren. Wie verhalten sich literarische Figuren zueinander? Was hat das eine historische Ereignis mit dem anderen zu tun? Warum verändern sich Theateraufführungen über die Zeit? Warum verwendet der Komponist in diesem Stück das eine Motiv und nicht das andere?
Unsere Daten- und mathematischen Modelle sind lediglich Handwerkszeug, um inhaltliche Forschungsfragen zu beantworten. Unsere Forschungsfragen sollten demnach verstärkt bei der Entwicklung von Modellen berücksichtigt werden.

Drei Punkte möchte ich hervorheben, die mir zur Modellhandhabung auf der DHd 2020 ins Auge gesprungen sind.
(1) Warum wird der Modellbegriff so selten differenziert? Bin ich die einzige, die von den verschiedenen Modelldefinitionen verwirrt ist oder geht es anderen genau so?
(2) Warum bauen wir riesige Datenmodelle deren Fertigstellung sehr lange dauert? Wir müssen daher lange warten bis wir endlich unsere Forschungsfragen beantworten können.
(3) Warum bauen wir riesige Datenmodelle mit dem Anspruch universell nutzbar zu sein? Wir wissen nicht, ob der große Aufwand wirklich nötig ist, um unsere Forschungsfragen zu beantworten.

Was wäre also zu tun? Hier meine kleine subjektive, provisorische Wunschliste.
(1) Wir sollten spezifisch sein, wenn wir den Modellbegriff benutzen und genau sagen, welcher Modelltyp gemeint ist. Das erleichtert die Kommunikation in einem interdisziplinären Feld wie den DHs.
(2) Wir sollten kleine anwendungsspezifische Datenmodelle bauen, bevor wir uns an riesige, universelle Datenmodelle machen. Erste Forschungsfragen können so zeitnah bereits mit einer abgespeckten Version des Datenmodells adressiert werden.
(3) Wir sollten Daten- und mathematische Modelle inkrementell und iterativ entwickeln anstatt sie in einem Rutsch zu bauen (Wasserfallprinzip). Nach jeder Iteration kann das Modell verwendet werden, um eine spezielle Forschungsfrage zu beantworten. Je nachdem wie gut das gelingt, wird das Modell stetig angepasst. So beugen wir vor, dass ein riesiges, aufwendig erstelltes Modell am Ende für die Beantwortung einer Forschungsfrage nutzlos ist.

Fazit:
Erstens, die DHs sind ein interdisziplinäres Feld, wo verschiedene Modellbegriffe kursieren. Wir sollten daher zwischen Daten- und mathematischen Modellen differenzieren.
Zweitens, wir sind WissenschaftlerInnen, weil wir uns für inhaltliche Zusammenhänge interessieren. Würde unser Fokus auf der Erstellung von Datenmodellen liegen, wären wir Software-Entwickler oder Datenbankmanager geworden. Die Erstellung von Modellen ist kein Zweck an sich, sondern sollte ein Mittel sein, um Forschungsfragen zu beantworten.

5 Kommentare Kommentar schreiben
  • no image

    Reisestipendiatinnen und -stipendiaten der DHd 2020 – Übersicht und Beiträge | DHd-Blog

    Antworten

    […] Ramona Roller (ETH Zürich) – @ramona_rollerWas ist ein Modell und wozu brauchen wir es? In: DHd-Blog, 12.3.2020, https://dhd-blog.org/?p=13186. […]

  • Frederike Neuber

    Antworten

    Vielen Dank für diesen schönen Beitrag zum Thema „Modelle“, auf den ich direkt anspringe..

    Meines Erachtens erschöpfen sich Datenmodelle nicht als Mittel zur Datenvorverarbeitung. Die Bildung eines Modells kann in (interdisziplinären) Arbeitsgruppen dabei helfen, ein gemeinsames Verständnis komplexer Domänen zu schaffen. Ich verstehe die Modellbildung selbst als heuristischen Prozess, in dem man das bestehende Wissen über einen Gegenstand (z.B. einen Text oder ein Bild) erweitert, hinterfragt und schärft. Insofern sehe ich die *Modellbildung als Teil der Forschung*, in der Wissen über ein Objekt angereichert wird und Theoriebildung entsteht. Außerdem sind Modelle die Grundlage der Daten, die schlussendlich ausgewertet werden können, wobei die Ergebnisse einer Auswertung sich (u.a.) aus der Perspektive der vorherigen Modellierung ergeben.

    Konkret zu deinen Punkten/Wünschen in Sachen Modellbildung meine Sicht der Dinge:

    (1) Ja, wir sollten spezifisch sein, welch Art von Modell wir meinen. Ein gemeinsames Verständnis kann z.B. durch ein konzeptuelles Modell des „Modellbegriffs“ entstehen. Ja, das ist jetzt sehr meta.. aber warum nicht?!

    (2) Datenmodelle sollten keinem Selbstzweck dienen, sondern ein bestimmtes Ziel verfolgen und dieses spezifisch abbilden. Datenmodelle müssen in der Welt der digitalen Ressourcen aber auch anschlussfähig und nachnutzbar sein, daher macht die Verwendung von Standards und der Anspruch der Generalisierung Sinn. Wenn jeder bei der Modellierung nur an sich denkt, ist unsere Arbeit auf Dauer – salopp gesagt – für die Katz. Beispiel: Dank der Entwicklung des riesigen TEI-Modells kann man kodierte Texte aus verschiedenen Projekten heute mit relativ überschaubarem Aufwand aggregieren oder austauschen. Viele Textkorpora, die heute die von Dir ersehnten Auswertungen betreiben, setzen sich aus kleineren Korpora zusammen (das gleiche gilt m.E. für Bilddatenbanken u.ä. ) Man stelle sich mal vor, jeder würde hier sein eigenes Format/Vokabular verwenden – wie will man da jemals annähernd an big data rankommen und die wirklich spannenden Fragen stellen? Die TEI ist m.E. übrigens auch ein gutes Beispiel dafür, dass Wissen über Texte präzisiert und explizit gemacht wurde (ich sage immer der wahre Wert der TEI sind die Gedanken über Text und die Definitionen, weniger das Kodierungsvokabular).

    (3) Iteration macht Sinn und ich finde auch, dass große Datenmodelle eher bottom-up als top-down entstehen sollten.

    Ich persönlich habe den Aspekt „Modellierung“ auf der DHd-Konferenz dieses Jahr als unterrepräsentiert empfunden. Das mag daran liegen, dass wir jetzt eine kritische Masse an Daten und Tools zur Beforschung zur Verfügung haben und die Erstellung der Daten in den Hintergrund rückt. Nichtsdestotrotz sehe ich den Aspekt der Modellbildung als wichtigen Teil der DH und als kritischen Prozess, der Wissenschaftlichkeit fordert (.. die übrigens auch Research Software Engineers oder Datenbankmanagern haben können). Gerade in Projekten, in denen Geisteswissenschaftlern und Informatiker zusammenarbeiten braucht es oft eine DH-Person mit Modellierungswissen zur Vermittlung, um die Domäne und die Forschungsfrage bestmöglich abzubilden und im richtigen Format bzw. Vokabular zu formalisieren. Fast alle Unternehmungen der digitalen Geisteswissenschaften, auch die Auswertung großer Textmengen zur Beantwortung von Forschungsfragen, stehen und fallen mit der Qualität der Datenbasis, die sich wiederum aus ihrer Modellierung ergibt. Mir hat daher bei vielen Textauswertungsvorträgen oft ein kritischer Blick auf die Datenbasis gefehlt.

  • Tessa Gengnagel

    Antworten

    Danke für diesen Erfahrungsbericht! Aus Zeitgründen habe ich dazu nur ein paar kurze Anmerkungen (eigentlich müsste man hier einige Sätze aufbohren und mit ein paar Missverständnissen aufräumen):

    1. Die Digital Humanities haben, wie der Name bereits sagt, einen Schwerpunkt in den Geistes- und Kulturwissenschaften. Hier eröffnet sich bereits eine recht große Kluft zu den Sozialwissenschaften. Ich sage das ganz ohne Wertung, es ist einfach so. Das Missverständnis liegt also nicht nur in den Digital Humanities selbst, sondern in den verschiedenen Fachkulturen, also in teilweise ganz fundamentalen methodologischen und epistemologischen, wenn nicht gar gesamtwissenschaftstheoretischen Grundlagendebatten begraben. Die kann man weder auf die Digital Humanities abschieben noch in ihnen lösen.

    2. Gerade die Auseinandersetzung zum Thema „Modell“ und „Modellierung“ ist in den DH ein altes Steckenpferd, auch wenn es auf theoretischer Ebene seit Willard McCarty 2005 keinen substantiellen Beitrag mehr dazu gegeben hat. Der Begriff wird oftmals nicht differenziert verwendet, das ist wahr, und das ist ein Problem. Aber schon Nelson Goodman hat ja bekanntermaßen in seinem Werk „Languages of Art“ (1968/1976) festgehalten: „Few terms are used in popular and scientific discourse more promiscuously than ‘model’. A model is something to be admired or emulated, a pattern, a case in point, a type, a prototype, a specimen, a mock-up, a mathematical description—almost anything from a naked blonde to a quadratic equation—and may bear to what it models almost any relation of symbolization.“ — Es handelt sich also auch hierbei um kein DH-spezifisches Phänomen oder Problem. Diese Begriffsunschärfe ist in vielen Fächern vielmehr pandemisch und fällt in DH nur teilweise etwas mehr auf, weil bzw. wenn zwischen den Gesprächspartnern eine gemeinsame fachliche Grundlage, d.h. von den Grundfächern her gedacht, fehlt und zudem auch keine vergemeinsamende Verankerung in DH-Sprache und -Methodik gegeben ist.

    3. Zu sagen, auf der einen Seite gibt es mathematische Modelle und auf der anderen Seite gibt es Datenmodelle greift viel zu kurz und beschreibt weder auf der einen Seite ein wissenschaftlich-allgemeingültiges Verständnis noch auf der anderen Seite ein davon abzugrenzendes DH-Verständnis. Darauf kann ich jetzt leider nicht näher eingehen, aber ich halte es für wertvoll, dass dieser Blogbeitrag hier einmal mehr ein Problem in der Wissenschaftskommunikation aufzeigt, und dessen sind die DH ganz eindeutig schuldig.

    • Frederik Elwert

      Antworten

      Ich bin mir nicht so sicher, dass ich die Grenze zwischen Humanities und Social Sciences hier so scharf ziehen würde. Es wird sicherlich auch nicht einfacher dadurch, dass die englischen und deutschen Bezeichnungen nicht unbedingt deckungsgleich sind. Aber gerade das Begriffspaar „Geistes- und Kulturwissenschaften“, das ich jetzt schon öfter als Näherung an die „Humanities“ gelesen habe, finde ich problematisch. Entweder führt das die „Kulturwissenschaften“ sehr eng, oder die Grenze zu den Sozialwissenschaften wird auf einmal sehr durchlässig. Ich würde z.B. die Ethnologie eindeutig als Kulturwissenschaft bezeichnen, aber dann halte ich die Übergänge zur qualitativ arbeitenden Soziologie für fließend.

      Und hier würde ich auch durchaus eine Brückenfunktion der DH sehen: Sie sind eben nicht nur die digitale Variante der klassischen Geisteswissenschaften, sondern führen über Cultural Analytics, Computational Humanities oder wie man das nennen mag gerade auch quantitative bzw. computationelle Ansätze ein, die sonst eher in den Sozialwissenschaften üblich waren. M.E. haben die DH damit gerade das Potenzial, die alte Kluft zwischen quantitativen und qualitativen Ansätzen in den Sozialwissenschaften zu überbrücken (falls man jetzt mit den Computational Humanities nicht am Ende wieder in die gleiche Falle tappt).

      Um das aber begrifflich klarer zu fassen, finde ich die Unterscheidung von Ramona Roller doch hilfreich. Sie ist sicherlich nicht erschöpfend (es gibt noch weitere Arten von Modellen) und auch nicht zwingend wissenschaftstheoretisch zu lesen. Aber gerade für die DH finde ich es gut, wenn man benennen kann, warum z.B. das CIDOC Conceptual Reference Model und ein Topic Model eben unterschiedlich sind – und auf welcher Ebene sie aber doch wieder Gemeinsamkeiten haben.

  • Georg Schelbert

    Antworten

    Interessantes Thema und hier sind ja auch gleich sehr fundierte Meinungen. Bin sehr auf Tessa Gengnagels Arbeit gespannt. Modell und Modellieren kann so Vieles bedeuten und zugleich spielen viele diese Aspekte in der Praxis der DH ganz unbestritten eine Rolle. Das macht den Themenkomplex spannend. Sicherlich werden die Konzepte für Modell und Modellieren jeweils zu sehr aus den jeweilgen Disziplinen gesehen; da wäre mehr Austausch nötig, wie er hier ja beginnt – ist freilich auch anstrengend und nicht immer sind die Kapazitäten dafür da. Wie ja auch bei Goodman anklingt, geht die Bedeutungsspanne weit über die Gegenübersetzung von mathematisches Modell vs. Datenmodell hinaus. Sofern es in den DH fast immer um konktretes Kulturgut geht, kommt der riesige Bereich des abbildenden Modellierens – oder wie immer man das nennen mag – hinzu (der ja wohl auch den Ursprung des Begriffskonzepts Modell bildet). Das digitale Format erzeugt hier ganz neue Querverbindungen (oder deckt sie auf) – ist nicht schon ein Digitalbild einerseits ein abbildendes Modell und zugleich ein Datenmodell, weil es die räumliche/visuelle Wirklichkeit in ein System von 0 u. 1 bringt? Habe versucht erste „Brückenschläge“ zu formulieren – auf schmaler, etwas disparater Materal- und Literaturbasis: https://books.ub.uni-heidelberg.de/arthistoricum/catalog/book/515/c7449

Kommentar schreiben