Twitter als Quelle – Einige Beobachtungen zum Twitterarchiv der #DHd2022

0 Veröffentlicht von Eike Martin Löhden am
Abbildung 1 – Tweets pro Stunde während der Konferenztage

„Kulturen beruhen auf Erinnerung, auf Praktiken der Speicherung und der Überlieferung.“[1] Mit diesem Satz leitete der Verband der Digital Humanities im deutschsprachigen Raum seine 8. Jahrestagung ein, die eigentlich in Potsdam geplant, dann aber komplett virtuell ausgetragen wurde. Was heißt das für eine Tagung, die sich dem Einfluss der Digitalisierung auf unsere Kulturpraktiken widmen sollte? Welche Spuren im digitalen Raum hinterlässt die Tagung? Was davon wird wie gespeichert?

Native digitale Quellen werden in der Geschichtswissenschaft noch selten ausgewertet. Doch werden sie in der Zukunft eine immer größere Rolle spielen. Kathrin Passig stellte sich dieser Frage in der Closing Keynote: vom SciHub über das WebArchive bis zum deutschen Twitter Archiv, was gilt es zu archivieren und was brauchen wir dafür? Reicht uns ein Rucksack oder brauchen wir doch eher ein Rechenzentrum?

Für ein Twitter-Archiv der DHd 2022 braucht es wohl noch nicht einmal einen Rucksack, sondern es lässt sich problemlos auch auf einer MicroSD Karte speichern und ins Portemonnaie stecken. Die zusätzlichen 4,54 g der Karte fallen dort vermutlich überhaupt nicht auf und auch Micro-SD Karten gibt es bereits mit bis zu 1 TB Speicherplatz.[2] Das Problem wäre dabei viel eher, dass man die Karte verliert, denn im Gegensatz zu einem USB-Stick kann man an einer Micro-SD Karte noch nicht einmal ein Trageband anbringen. Mit seinen 2,7 MB passt das Twitter-Archiv der DHd 2022 aber auch auf eine gute alte Diskette. Nur dass die dann etwas mehr Platz einnimmt und ein paar Gramm mehr auf die Waage bringt.

Die von mir im Kontext der Tagung gesammelten Tweets mit dem Hashtag #dhd2022 erstrecken sich über einen Zeitraum von gut einem Monat: Der erste gespeicherte Tweet wurde am 17.02.2022 um 11:32 Uhr abgesetzt und der letzte am 18.03.2022 um 20:32 Uhr. Wie man vermutlich erwartet, steigert sich die Anzahl der Tweets während der Konferenztage: Vor Konferenzbeginn wurden durchschnittlich 18,5 Tweets pro Tag abgesetzt bei durchschnittlich 13,4 Nutzern:innen, jedoch mit leicht steigender Tendenz und starken Schwankungen[3]. Während der Konferenz waren es pro Tag durchschnittlich 701,75 und die durchschnittliche Anzahl an Tweets pro Nutzer pro Tag stieg auf 3,2 an. Es waren also nicht nur mehr Personen, die Tweets unter dem Tagungshashtag posteten, sondern die einzelnen Personen twitterten auch häufiger.

Die grundsätzliche Entwicklung während der Tagung wird wohl niemanden groß überraschen. Ein paar Beobachtungen sind aber doch erwähnenswert: Die meisten Tweets wurden Mittwoch, Donnerstag und Freitag abgesetzt. Vermutlich waren die meisten Teilnehmenden Montag und Dienstag zu sehr in den Workshops eingebunden, was kein Twittern nebenbei zuließ? Dass bei Vorträgen mehr getwittert wird, scheint die obige Abbildung zu bestätigen: Schaut man sich die Tweets von Dienstag an, so lassen sich mit Abstand die meisten Tweets pro Stunde zwischen 18 und 20 Uhr ausmachen: die Zeit der Opening Keynote von Amalia S. Levi.[4]

Am Freitag wurde der Höhepunkt der Woche mit 160 Tweets von 13 bis 14 Uhr und 106 von 14 bis 15 Uhr erreicht: vor und während der Abschlusskeynote von Kathrin Passig.[5] Im Anschluss nahmen die Tweetzahlen schnell ab (zwischen 16 und 17 Uhr waren es nur noch sechs Tweets).

Bei dieser Form der quantitativen Auswertung darf allerdings nicht die Reflexion der Quellengrundlage vergessen werden. „Digital born“-Quellen sind nicht immer uneingeschränkt zugänglich und es muss die Frage gestellt werden, wer diese Spuren überhaupt hinterlassen kann? Im Kontext einer Twitter-Auswertung sind dies erstmal die Nutzerinnen und Nutzer von Twitter. Auch ist das Quellen-Corpus durch die Formulierung der Filteranweisung begrenzt: Hier sind nur die Tweets mit einbegriffen, die in einer beliebigen Form das Hashtag #DHd2022 enthalten. Was bedeutet das für die Auswertung? Das Prinzip eines Hashtags ist, Aussagen zu einem Thema, einer Veranstaltung oder zu einem allgemeineren Kontext zu bündeln und Nutzende zu vernetzen. Wenn also die Tweets eines Hashtags gesammelt ausgewertet werden können, ist es möglich Rückschlüsse auf Inhalte des Diskurses und die Herkunft der Tweets zu ziehen.

Es lässt sich untersuchen, welche Nutzerinnen und Nutzer getweetet haben, teilweise auch von wo aus getwittert wurde und mit welchen Anwendungen die Tweets verschickt wurden. Im Tweet-Corpus der DHd2022 stammt der größte Teil aus der Twitter Web App (45 %). Zusammengerechnet mit den Tweets aus den Handy-Apps „Twitter for Android“ und „Twitter for iPhone“ (beides 13% der Tweets), kommt man auf 71 % aller Tweets. Zu fragen wäre, ob bei einer Präsenzkonferenz der Anteil der Nutzung mobiler Apps höher wäre, als wenn alle vor dem heimischen Rechner sitzen und der Tagung per Videokonferenz folgen. Ebenso wurden automatisierte Verfahren zum Senden der Tweets verwendet: 2 % wurden mit dem, von Jürgen Hermes und seinem Team entwickelten, Tool autoChirp[6] gepostet.

Auch die Nutzenden, die, während der DHd Tagung getweetet haben, sind in ihrer grundsätzlichen Twitter-Nutzung sehr verschieden (siehe Abb. 2): Während zwei Accounts bereits über 500.000 beziehungsweise mehr als 600.000 Tweets verschickt haben,[7] liegt der Durchschnitt bei knapp 13.000 Tweets pro Account. Ein ähnliches Bild zeichnet sich bei der durchschnittlichen Anzahl an Followern: Sie liegt bei knapp 1.300, während es zwei Accounts mit über 35.000 Followern gibt.

Abbildung 2 – Auswertung der Twitter-Nutzer:innen

Schon die alleinige Betrachtung der Tweets und Nutzerinnen und Nutzer im Umfeld der Jahrestagung ist sehr aufschlussreich: Tinghui Duan hat beispielsweise eine sehr spannende Netzwerkvisualisierung anhand der Twitter-Nutzerdaten durchgeführt und zeigt darin, wie diese während der Tagung in Beziehung zueinander standen.[8] Es darf in diesem Kontext jedoch nicht vergessen werden, dass hier lediglich Aussagen und Beobachtungen über Tweets mit dem hashtag DHd2022 gemacht werden können und andere Äußerungen, Akteurinnen und Akteure unsichtbar bleiben. Doch diese Tweets gehören zu dem, was uns in Zukunft von der Jahrestagung 2022 bleibt, wenn wir sie archivieren. Und vielleicht gibt es in den nächsten Jahren ähnliche Untersuchungen, die dann Vergleiche mit den hier gesammelten ermöglichen.

 


Die gesamte Auswertung mithilfe eines Jupyter-Notebooks befindet sich in einem GitHub-Repository.

[1] DHd2022 – Potsdam, https://web.archive.org/web/20220312030146/https://www.dhd2022.de/

[2] Als Beispiel: https://web.archive.org/web/20220131222055/https://www.westerndigital.com/de-de/products/memory-cards/sandisk-extreme-uhs-i-microsd#SDSQXA1-1T00-GN6MA

[3] Die Standardabweichung beträgt in den Tagen vor der Konferenz 15,96.

[4] Levi, Amalia S., “Filling the Gaps: Digital Humanities as Restorative Justice“. Opening Keynote auf der DHd 2022. 8. Tagung des Verbands Digital Humanities im deutschsprachigen Raum „Kulturen des digitalen Gedächtnisses“, Potsdam 2022. https://www.dhd2022.de/opening-keynote/

[5] Passig, Kathrin, „Rucksack oder Rechenzentrum“. Closing Keynote auf der DHd 2022. 8. Tagung des Verbands Digital Humanities im deutschsprachigen Raum „Kulturen des digitalen Gedächtnisses“, Potsdam 2022. https://www.dhd2022.de/closing-keynote/

[6] https://autochirp.spinfo.uni-koeln.de/home.

[7] Einer davon ist ein Bot.

[8] Für die Gephi-Datei siehe: https://github.com/t-duan/dhd2022

Kommentar schreiben