Herzlich Willkommen im Blog! Link zur Hauptseite des Blogs Der Blog ist umgezogen! Zu finden sind unsere Erlebnisse nun hier

Hier berichten wir von den großen und kleinen Erlebnissen unserer Ausbildungsreise – von Exkursionen in alte und neue Bibliotheken, von Studienfahrten und Praktika in fernen und nicht ganz so fernen Städten, von Vorträgen, Konferenzen und natürlich dem Studienleben in München.

Herzlich Willkommen im Blog! Link zur Hauptseite des Blogs

Weltkarte




Tweets für die Ewigkeit

Avatar of Student/in Student/in | 16. März 2023 | Bibliotheken | Deutschland



Twitterlogo

Seit der Übernahme von Twitter durch Elon Musk ging es bei dem Kurznachrichtendienst ziemlich turbulent zu: Massenentlassungen, Musks verquere Vorstellungen von Meinungsfreiheit und die Zunahme von Hate Speech auf der Plattform veranlassen immer mehr Nutzer:innen dazu, ihre Twitter-Konten zu löschen oder sich auf die Suche nach Alternativen wie Mastodon zu machen.

Die Deutsche Nationalbibliothek will deshalb nun mit dem Science Data Center for Literature ein ambitioniertes Projekt starten, um alle deutschsprachigen Tweets zu sichern und für zukünftige Forschungsprojekte nutzbar zu machen. Dabei steht sie unter einem gewissen Zeitdruck, nicht nur weil gelöschte Inhalte nicht mehr im Archiv aufzufinden sein werden, sondern auch weil Twitter bereits angekündigt hat, die Schnittstellen, die für eine wissenschaftliche Auswertung der Inhalte verwendet werden, zu schließen. Deshalb bittet die DNB jetzt um Mithilfe von Menschen, die Zugriff auf die Academic Access API haben und sich am Download des Twitter-Archivs beteiligen möchten. Jede Einzelperson mit einem solchen Zugang kann maximal 10 Millionen Tweets pro Monat herunterladen, so könnte die DNB also mit etwa 400 Unterstützer:innen alle 4 Milliarden Tweets sichern. Den Speicherplatz zur Archivierung stellt die DNB bereit. Im Anschluss könnte das deutschsprachige Twitter-Archiv der Forschung z.B. als Korpus für Data Mining zur Verfügung gestellt werden.

Dieses Projekt stellt ein Abweichen von der sonstigen Archivierungspolitik der Nationalbibliothek dar. Wenngleich seit 2006 auch ausgewählte Webseiten in bestimmten Abständen gespeichert werden, so gehörten Social-Media-Inhalte bisher eigentlich nicht zum Sammlungsbereich der Nationalbibliothek. Tweets sind jedoch in den letzten Jahren immer wieder als Datenpool für Auswertungen in Forschungsprojekten der Digital Humanities herangezogen worden und eignen sich durch ihre (bisher) freie Verfügbarkeit gut dafür. Dennoch stellt sich die Frage, was in Zukunft mit den nicht deutschsprachigen Inhalten passieren wird. Bei anderen Medienformen verfolgt die DNB die Richtlinie, Germanica zu sammeln, das heißt auch Werke in anderen Sprachen, die über Deutschland verfasst wurden. Angesichts der Fülle an Daten auf Twitter ist es sicher nicht möglich, relevante Twitterkanäle einzeln herauszufiltern und deren Inhalte zu archivieren. Stattdessen konzentriert man sich darauf, eine große Menge an Daten zu speichern, da vor allem die Masse für Datenauswertungen in den Digital Humanities interessant ist.

Ein ähnliches Projekt der Library of Congress beispielsweise hat sich für einen anderen Weg entschieden. Nachdem die LoC zunächst mit dem Speichern des gesamten Archivs begonnen hatte, entschied sie sich 2017 für einen Kurswechsel und verkündete, nur noch selektiv beispielsweise zu bestimmten Themen oder Ereignissen wie Wahlen zu sammeln - die Anzahl der täglich abgesetzten Tweets war einfach zu groß geworden.

lm

 

Quellen:

Deutsche Nationalbibliothek: "Deutschsprachiges Twitter archivieren - machen Sie mit!". Deutsche Nationalbibliothek, 08.03.2023. URL: https://www.dnb.de/DE/Professionell/Sammeln/Sammlung_Websites/twitterArchiv.html?nn=246608 (zuletzt abgerufen am 16.03.23)

Mayer, Iris: "Vier Milliarden Tweets fürs Archiv". Süddeutsche Zeitung, 08.03.2023. URL: https://www.sueddeutsche.de/panorama/twitter-archiv-deutsche-nationalbibliothek-1.5764923 (zuletzt abgerufen am 16.03.23)

Wamsley, Laurel: "Library of Congress Will No Longer Archive Everey Tweet". NPR, 26.12.2017. URL:

https://www.npr.org/sections/thetwo-way/2017/12/26/573609499/library-of-congress-will-no-longer-archive-every-tweet (zuletzt abgerufen am 16.03.23)

 

Foto von Brett Jordan auf Unsplash

 

Keine Kommentare mehr möglich!

1 Kommentar(e)

kobold |

21. März 2023

Interessant wäre auch die Frage, ob auch Teile des Dark Web für die Archivierung interessant wären. Grundsätzlich zeigt das Beispiel der DNB, dass das Internet schlicht zu groß und unübersichtlich ist. Ein anderes Problem ist natürlich, dass Social Media-Dienste wie Twitter Privatunternehmen sind, die die Verfügungsgewalt über ihre Daten haben. Vielleicht könnte in Zukunft ein europäisches Gesetz - analog zur Exemplarabgabepflicht der DNB - bestimmte Daten (wie zu Wahlen) von Social-Media Netzwerken ebenfalls abgabepflichtig machen an "digitale" Archive.