Data Feminism als Herausforderung für die Digital Humanities?

0 Veröffentlicht von Sarah Lang am

Im Zuge der Jahrestagung des DHd-Verbands veranstaltete die AG Empowerment einen Workshop zum Thema Data Feminism in den Digital Humanities (Organisation: Luise Borek, Nora Probst & Sarah Lang, technische Unterstützung: Yael Lämmerhirt).[1] In diesem kurzen Blogbeitrag sollen erste Zwischenergebnisse präsentiert werden, um die Veranstaltung zu dokumentieren und gleichzeitig auf dieses zentrale Thema aufmerksam zu machen. Zur Mitarbeit am Projekt sind alle weiterhin herzlich eingeladen und sollten sich bei Interesse bei der AG Empowerment melden. 

Zitiervorschlag: Luise Borek*, Elena Suárez Cronauer, Pauline Junginger, Sarah Lang, Karoline Lemke & Nora Probst, Data Feminism als Herausforderung für die Digital Humanities?, in DHd Blog, 01.07.2023. https://dhd-blog.org/?p=19571 *Autorinnenschaft aller Beteiligten zu gleichen Teilen

A machine-translated English version of this blog post can be found on the LaTeX Ninja Blog: https://latex-ninja.com/2023/07/01/data-feminism-as-a-challenge-for-digital-humanities/ 

 

Data Feminism – nach dem gleichnamigen Buch von Catherine D’Ignazio und Lauren F. Klein (MIT Press 2020) – ist eine Bewegung des intersektionalen Feminismus, die weiße, cis-männlich dominierte Narrative und Strukturen in der Data Science hinterfragt. Dies betrifft nicht nur die Datenanalyse, sondern auch die Modellierung, Erhebung, Kuratierung und Präsentation von Datensätzen. Für die Digital Humanities beinhalten datenfeministische Ansätze wichtige Impulse und spannende Forschungsdesiderate, doch sind sie bislang in der deutschsprachigen DH-Community noch nicht wirklich etabliert. Vor allem fehlt es an konkreten Richtlinien und Leitfäden, wie sich datenfeministische Ansätze in die alltägliche Projektpraxis der DH integrieren lassen. 

Die digitalen Geisteswissenschaften zeichnen sich neben ihrer Daten- und Technikkompetenz durch den Einfluss unterschiedlicher Fachtraditionen und disziplinspezifischer Methoden aus. Zugleich aber ist allen diesen Fachtraditionen gemein, dass sie von hegemonialen Normvorstellungen, Denkmodellen, Klassifizierungen, Institutionen und Strukturen geprägt sind, die sich aus patriarchalen, kolonialen, rassistischen, kapitalistischen und weiteren systemisch-hegemonialen Machtverhältnissen herausgebildet haben. Aufgrund ihrer objektorientierten Forschungspraxis in der Auseinandersetzung mit materiellen, bildlichen und textuellen Quellen des kulturellen Erbes besteht für die Digital Humanities die Gefahr, dass die in den Quellen vorfindlichen hegemonialen Denkmuster in die datenbasierten Forschungsdiskurse überführt werden, ohne von einer hinreichend machtkritischen Reflexion begleitet zu werden. Dabei geht es nicht nur darum, bei der Datafizierung (Datafication) und Kodierung des kulturellen Erbes neue epistemologische Rahmungen zu entwerfen, mit denen sich eine Übertragung bestehender Diskriminierungen ins Digitale verhindern lässt. Vielmehr betrifft eine machtkritische Reflexion auch die Akkumulation der Quellen und Daten selbst: So beruhen die Sammlungspraktiken häufig auf kolonialistischen, eurozentristischen, cis-männlichen Perspektiven, was die Frage aufwirft, wie die Digital Humanities mit den Leerstellen in den Archiven umzugehen gedenken, die das Erforschen von Perspektiven jenseits von cis-männlichen, weißen Narrativen erschweren oder ganz verhindern. 

Diese historisch gewachsene Dysbalance schlägt sich insofern nieder, dass Daten marginalisierter Gruppen oftmals gar nicht überliefert sind. Sind sie es doch, dann nur aus der Fremdwahrnehmung durch hegemoniale Gruppen. Archive erzeugen somit zugleich (Un)sichtbarkeiten und (Un)sagbarkeiten. 

Betroffen davon sind insbesondere Frauen und andere Gruppen, die sich jenseits von cis-männlichen Identitäten bewegen. Innerhalb von Sammlungen des kulturellen Erbes ist Geschlecht bzw. Gender in der Regel eine Kategorie, die eine spätere Zuschreibung und keine Selbstbezeichnung darstellt, oftmals aufgrund historischer Umstände. Ein geschlechtersensibler Umgang mit diesen Daten fängt daher bei deren Modellierung an. Die gendersensible Repräsentation ist dabei nur ein wichtiger Baustein unter vielen, der Digital Humanists großflächig betrifft, aber noch nicht die entsprechende Aufmerksamkeit und sorgfältige Reflexion erhalten hat. So ist die Klassifikation von Geschlecht bzw. Gender und deren digitale Abbildung immer auch eine ethische Entscheidung. Das (nachträgliche) Anpassen in historisch gewachsene Systematiken der Klassifikation ist dabei jedoch überaus komplex und stellt eine ganze Reihe von Herausforderungen, die neben informationswissenschaftlichen auch grundlegende interdisziplinär-wissenschaftshistorische Implikationen haben. Neben ethischen und politischen Aspekten müssen deshalb im wissenschaftlichen Kontext Kriterien formuliert werden, wie mit den bestehenden Dysbalancen vor dem Hintergrund quantitativer Verfahren umgegangen werden kann, weil die durch diesen sogenannten ‘Gender Data Gap’ erzeugten Verzerrungen wissenschaftliche Ergebnisse und deren Aussagefähigkeit beeinträchtigen. 

An dieser Stelle setzte unser Workshop an. Gemeinsam mit den Teilnehmenden sollte ein erster Aufschlag für eine Handreichung erarbeitet werden, mit deren Hilfe sich Interessierte kompakt grundlegende Informationen und Hilfestellungen bezüglich folgender Fragen beschaffen können: 

  • Was ist Data Feminism und inwiefern findet der Begriff in Digital Humanities Diskursen Berücksichtigung? 
  • Wieso braucht man Data Feminism in den DH und inwiefern sollten dessen Ansätze in den bestehenden Diskursen der DH Berücksichtigung finden? 
  • Wie kann Datenfeminismus in den Digital Humanities aussehen und was muss er umfassen? 
  • Was lässt sich unter dem Begriff Data Feminism verstehen?
  • In welchen Typen von Projekten oder Forschungsfragen sollten sich Forschende aufgerufen fühlen, den Forderungen des Data Feminism nachzukommen? Und falls ja, gibt es einfache Ansätze, die ohne weiteres gleich zu Projektstart mitgedacht und umgesetzt werden können? 
  • Wie können datenfeministische Projekte in den DH konkret aussehen? Inwiefern lassen sich Forschungsfelder definieren, die für Interessierte einen guten Ausgangspunkt bilden, um einige Ansätze des Data Feminism unmittelbar und praktisch umzusetzen?

Im Zuge des Workshops wurden vier Problemstellungen diskutiert, deren zentrale Prämissen hier kurz umrissen werden sollen (siehe Abstract). In der Diskussion wurde schnell klar, dass auch die Begrifflichkeiten, mit denen wir arbeiten, einen eigenen Arbeitsbereich darstellen, der hier nun auch beachtet wird.

Begriffe

Die Problematik der dynamischen Natur von Begriffen und Konventionen im Kontext von Feminismus und gendergerechter Sprache ist uns den ganzen Workshop über immer wieder begegnet. Wichtig ist daher, dass Begriffe reflektiert genutzt und ihre Nutzung sowohl in digital bereitgestellten und bearbeiteten historischen Quellen als auch in begleitend erscheinenden Texten begründet werden. Auch die eigene Position in der Gesellschaft sollte als Teil wissenschaftlicher Arbeit transparent gemacht und reflektiert werden. Uns ist es sehr wichtig, inklusive Begriffe wie beispielsweise „FLINTA“ [2], zu benutzen, um uns von reaktionären Strömungen des Feminismus abzugrenzen. Gleichzeitig kann im Bezug auf intersektionale Formen der Diskriminierung aufgrund der mangelnden Diversität der Workshopteilnehmer:innen nur eine Perspektive von Critical Whiteness geleistet werden.

Ebenso müssen Begriffe wie Geschlecht, Gender und Sex sowie deren Verhältnis zueinander kritisch überprüft werden. Während der deutsche Begriff des biologischen Geschlechts mit dem englischen sex deckungsgleich übersetzt werden kann, verhält es sich mit dem Begriff Gender anders. Eine adäquate Übersetzung des Begriffs ist problematisch: Er befindet sich im Spannungsfeld von Geschlechtsidentität, sozialem Geschlecht und dem Verhältnis zwischen Geschlecht und Geschlechterrolle. Im Folgenden halten wir deswegen an dem englischen Begriff Gender fest und definieren diesen als kulturelle, gesellschaftliche und historisch unterschiedlich bedingte Identitätskonzepte, die den Kategorien des Weiblichen und Männlichen zugeschrieben sind. [3] Gender als historisch soziale Kategorie nimmt hierbei eine entscheidende Rolle für den Umgang mit Daten im Sinne des Data Feminism ein. 

Data Gender Gap und das kulturelle Erbe

Vor dem Hintergrund des Sammlungsauftrags von Gedächtnisinstitutionen müssen Strategien und Maßnahmen entwickelt werden, die den bestehenden Data Gender Gap verkleinern. Gerade im Hinblick auf die wachsende Zahl digitaler Archive, die sich dem Erhalt des kulturellen Erbes widmen, sollten bestehende Marginalisierungen nicht reproduziert, sondern neue und problemorientierte Strategien entwickelt werden. Dies sowohl mit Blick auf zeitgenössische wie historische Daten. Die Erhebung von Normdaten, mit denen publizierende Personen systematisch erfasst werden, verkörpert in diesem Zusammenhang ein grundlegendes Problem: Normdaten haben durch eine unkommentierte und unzureichende Datenerhebung und -pflege oft voreingenommenen Charakter. Es ist fraglich, ob mit dieser Form der Erhebung die Komplexität von Geschlecht und Gender abgebildet werden kann. Um die Möglichkeiten der Modellierung von  Geschlecht zu erweitern, müssen wir uns von dem Konzept von Geschlecht als binärer, feststehender Kategorie lösen und den Begriff des Gender stärker einbeziehen. Ein Ansatz wäre z. B. kritisch kommentierte, multiple Daten unter Bezugnahme temporärer Aspekte mit Angaben zur Gewichtung oder Qualifizierung.

Modellierung, Kuratierung, Daten- und Korpuskritik

Datenmodelle sind als zeitlich, räumlich und situativ bedingte Zugriffe auf Realität zu verstehen, die notwendigerweise mit der Reduktion von Komplexität einhergehen. Für die Nachnutzung eines Datenmodells oder der auf diesem Modell basierenden Daten bedeutet dies, dass der Entstehungskontext des Modells unter Einbezug der dahinter liegenden Wissenstraditionen berücksichtigt werden muss. Das Modell sollte also daraufhin befragt werden, wer was zu welchem Zweck modelliert hat und was dadurch sichtbar bzw. unsichtbar gemacht wird. Bei der Modellierung von Identitätskategorien ist zu bedenken, dass Sichtbarkeit für marginalisierte Personen ein Gefahrenpotential enthält. D’Ignazio und Klein nennen dies das „paradox of exposure“ (2020, 105). Verschiedene weit verbreitete Datenmodelle wie das PICA-Erfassungsschema der GND, TEI-XML oder die Datenmodellierung in Wikidata stellen eine Herausforderung für die Modellierung von Gender und Geschlecht dar. Hier ist oftmals nur eine binäre Zuordnung von Geschlecht möglich ohne eine Unterscheidung zwischen Sex und Gender oder ohne eine fluiden Zuordnung von Gender unter temporären Aspekten. Ebenso wenig werden Unsicherheiten bezüglich Fremd- und Selbstbezeichnung von Gender modelliert.  Gleichzeitig existieren immer mehr Beispiele, die sich um eine sensiblere Gestaltung verschiedener Identitätskategorien bemühen. [4] Für die Community wäre es erstrebenswert, hieraus Lessons Learned und Best Practices abzuleiten. Dazu möchten wir als AG mit unseren zukünftigen Arbeiten beitragen. 

Maschinelles Lernen als Bias-Verstärker oder Chance?

Maschinelles Lernen muss im Zusammenhang mit Data Feminism und den damit einhergehenden Überlegungen differenziert betrachtet werden. Damit maschinelles Lernen eben nicht als Bias-Verstärker wirkt, gilt es zwei Aspekte besonders in den Fokus zu rücken:  Zum einen müssen die Daten, die als Grundlage für machine learning Tools genutzt werden, nachvollziehbar und überprüfbar sein. Das betrifft sowohl Fragen der Personenrechte als auch des Urheberrechts (z.B. bei der Nutzung  großer Bilddatenmengen) sowie Aspekte einer ethischen Datenerhebung (z.B. die Filterung großer Textmengen unter prekären Arbeitsbedingungen). Zum anderen gilt es aber auch, das eigene Verständnis der Tools, Software und Algorithmen, die wir anwenden, um unsere Analysen durchzuführen, kritisch zu hinterfragen: Verstärken wir damit ggf. bestehende Biases, ohne uns dessen bewusst zu sein? Können wir dafür garantieren, eine kritische Methoden- bzw. Algorithmusdiskussion zu leisten, die die Nachvollziehbarkeit unserer Forschung garantiert? Auch sollte bei Überlegungen der Nachnutzung solcher Technologien die Entwicklungshistorie diskutiert werden: Können wir Einblick in die Arbeitsgruppen erhalten, die Tools/Software/Algorithmen entwickelt haben? Welche Gefahr geht von „persönlichen Biases“ solcher Gruppen aus, gerade wenn diese nicht divers besetzt sind oder waren? 

Fazit und Future Work

Um den hier angerissenen Herausforderungen, die sich durch die Beschäftigung mit Data Feminism abzeichnen zu begegnen, haben die digitalen Geisteswissenschaften die Aufgabe und Chance, Strukturen zu schaffen, um Biases und Dysbalancen kritisch entgegenzuwirken. Hier kann bereits aus vorhandenen Erfahrungen und Perspektiven aus verschiedenen, spezifischen Forschungsprojekten gelernt und so Räume für Dialoge geöffnet werden, von denen die Fachkultur der Digital Humanities nur profitieren kann. Wir sprechen uns dafür aus, Strategien und Maßnahmen zu entwickeln, um den Data Gender Gap sichtbar(er) zu machen und wo möglich zu verkleinern, und zwar sowohl mit Blick auf Daten der Gegenwart als in Bezug auf historische Daten. Statt Geschlecht als binäre, feststehende Kategorie zu benennen, braucht es mehr Möglichkeiten der Modellierung, wie kommentierte multiple Daten, ggf. mit Gewichtungen oder Qualifizierungen sowie idealerweise mit kritischer Kommentierung unter Einbezug von Gender mit temporären Aspekten. Klassifikation von Gender und deren digitale Abbildung ist immer eine ethische Entscheidung. Neben ethischen und politischen Aspekten gilt es daher auch hinsichtlich wissenschaftlicher Kriterien anzustreben, dem Data-Gender-Gap zu begegnen, da die dadurch resultierenden Verzerrungen auch wissenschaftliche Ergebnisse und deren Aussagefähigkeit beeinträchtigen. Dies gilt ebenso für die Nachnutzung von Datenmodellen sowie Tools für das maschinelle Lernen. Wir sprechen uns für eine differenzierte Hinterfragung und Prüfung dieser sowie eine kritische Methoden- bzw. Algorithmusdiskussion aus, um unreflektierte und unbewusst übernommene Denkstrukturen der Modellierung, wie unzureichende oder fehlende Beschreibungen von Identitätskategorien, entgegenzuwirken. 

Die Entwicklung und die Diskussion dieser Strategien und Maßnahmen können hier nur angedeutet werden. Der produktive Austausch im Rahmen des Workshops auf der DHd-Konferenz hat nicht nur den großen Bedarf und bestehendes Interesse an dem Thema offenbart, sondern auch konkrete Erfahrungen aus Forschungsprojekten und vorhandene Expertisen zusammengebracht. 

Hier möchten wir auch zukünftig anknüpfen, um dazu beizutragen, das Thema in den Digital Humanities stärker zu verankern und entsprechende Fragestellungen zu ermöglichen.  Perspektivisch möchten wir daher eine Handreichung zu Data Feminism in den Digital Humanities erstellen. In dieser sollen grundlegende Informationen zum praktischen datenfeministischen Arbeiten in den Digital Humanities vermittelt werden, um so einen unkomplizierten und niedrigschwelligen Einstieg in das Thema sowie einen gebündelten Überblick zu geben. Des weiteren sollen konkrete Strategien entwickelt werden, wie sich die Forderungen des Data Feminism im Kontext der Digital Humanities umsetzen lassen, sowie Best Practice Beispiele als Orientierung für Forschungsprojekte und Forschenden zur Verfügung gestellt werden. Eine Auswahlbibliografie zum Thema ist bereits eingerichtet und wird kontinuierlich weitergepflegt.

Die AG Empowerment hat eine Arbeitsgruppe zu Data Feminism eingerichtet und lädt alle Interessierten herzlich ein, sich daran (aber auch an allen weiteren Aktivitäten) zu beteiligen!

Weitere Informationen dazu entnehmen Sie bitte unseren Webseiten und deren Kontakt-Sektionen: 

https://dig-hum.de/ag-empowerment

https://empowerdh.github.io/ 

 

 


Fußnoten

[1] Abstract und Auswahlbibliographie zum Workshop finden sich hier: Lang, Sarah, Borek, Luise, & Probst, Nora. (2023, March 10). Data Feminism in DH: Hackathon und Netzwerktreffen. DHd 2023 Open Humanities Open Culture. 9. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ (DHd 2023), Trier, Luxemburg. https://doi.org/10.5281/zenodo.7715422 . Als weiterer AG Empowerment Beitrag auf der DHd 2023 sei genannt: Tessa Gengnagel, Open DH? Mapping Blind Spots (DHd2023 Report),  in DHd Blog, 31. März 2023, https://dhd-blog.org/?p=19235  and Gengnagel, Tessa, Lang, Sarah, Probst, Nora, Gerber, Anja, Dang, Sarah-Mai, Duan, Tinghui, Grallert , Till, Keck, Jana, & Nyhan, Julianne. (2023, March 10). Open DH? Mapping Blind Spots. DHd 2023 Open Humanities Open Culture. 9. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ (DHd 2023), Trier, Luxemburg. https://doi.org/10.5281/zenodo.7715329 .

[2] Der Begriff Flinta steht für Frauen, Lesben, Inter Menschen, Nichtbinäre Menschen, Trans Menschen und Agender Menschen. Vgl. https://queer-lexikon.net/2020/05/30/flint/ 

[3] Vgl. https://queer-lexikon.net/2017/06/15/gender/ 

[4]  Differenzierte Rollenmodelle bei digitalen Projekten sind beispielsweise möglich mit: https://credit.niso.org/ . Weiterhin gibt es eine Reihe an Arbeiten zum Thema, so z.B. Modelling Gender Diversity – Research Data Representation Beyond the Binary ( https://dh-abstracts.library.virginia.edu/works/11783 ), Orlando Project (basierend auf CWRC Ontology: https://sparql.cwrc.ca/ontologies/cwrc-preamble-EN.html, Gender modelliert als Ereignis ), Women Writers Online, die Text Encoding Initiative unterstützt aber z.B. auch schon die Teilung in <sex /> und <gender /> (vgl. Beshero-Bondar, Elisa, Viglianti, Raffaele, Bermúdez Sabel, Helena, & Jenstad, Janelle. (2022, September 18). Revising Sex and Gender in the TEI Guidelines. Zenodo. https://doi.org/10.5281/zenodo.7091048 ), https://homosaurus.org/https://www.wikidata.org/wiki/Wikidata:WikiProject_LGBT, Ric-O als archivisches Erschließungsmodell betrachtet Geschlecht überhaupt nicht, sondern nur die Beziehung zum Objekt und anderen Daten: https://www.ica.org/standards/RiC/ontology#Person .

 

 

Allgemein   

Kommentar schreiben