Methode

Überblick über die Methodologie des Projekts

Diese Seite bietet einen Einblick in die methodische Grundlage unseres Projekts. Das Projekt basiert auf sechs integrierten Bausteinen.

Baustein I: Datenspenden

Der erste Baustein unseres Projekts ist die Sammlung digitaler Verhaltensdaten durch Datenspenden. Dabei handelt es sich um persönliche TikTok-Nutzungsdaten, die ursprünglich von TikTok selbst im Rahmen der Nutzung generiert wurden und nun von den Plattformnutzer:innen den Forschenden freiwillig zur Verfügung gestellt werden.

Wir nutzen zwei verschiedene Wege, um Datenspenden zu ermöglichen – jeweils auf der Grundlage europäischer Datenschutzvorschriften:

  1. Datenspenden gemäß der DSGVO (DSGVO-Abfrage)
    Nach der Datenschutz-Grundverordnung (DSGVO) sind Plattformbetreiber verpflichtet, ihren Nutzer:innen Zugriff auf alle Daten zu gewähren, die sie über sie gesammelt haben. Der Prozess beginnt mit einer Anfrage der Nutzer:in an die Plattform. Sobald die Daten bereitstehen, können sie heruntergeladen und anschließend über unsere Teilnahme-Seite hochgeladen werden. So können Nutzer:innen gezielt bestimmte Datenspuren für die Forschung zur Verfügung stellen.
  2. Datenspenden gemäß dem DMA und der Portability-API
    Dieser Weg ist im Digital Markets Act (DMA) verankert und zielt darauf ab, eine standardisierte Schnittstelle zu schaffen, über die Drittanbieter (in unserem Fall: das Projektteam) den Zugriff auf Nutzerdaten vereinfacht und sicher ermöglicht. Bei der Teilnahme wird die Nutzer:in zur Authentifizierungsseite von TikTok weitergeleitet. Dort erteilt sie eine einmalige Zustimmung, über die TikTok die Daten direkt an uns übermittelt – ohne dass sie manuell heruntergeladen und hochgeladen werden müssen.

Beide Wege führen theoretisch zu derselben Datengrundlage. Der zweite Weg ist jedoch deutlich nutzerfreundlicher und weniger aufwendig für die Teilnehmenden. Allerdings sind die Fragen der Datenvollständigkeit und qualität bei der Nutzung der Portability-API noch weitgehend unerforscht und unter anderem auch Gegenstand der Analyse dieses Projektes.

Was für Daten sammeln wir?

Die von den Nutzer:innen gespendeten Daten beziehen sich ausschließlich auf Aktivitäten rund um Inhalte und Akteure auf der Plattform. Dazu gehören beispielsweise:

  • Gesehene Videos
  • Likes, Shares und Saves
  • Follower- und Blockier-Listen
  • Zeitstempel (wann eine Aktivität stattfand)
  • Video-IDs oder Account-Namen (auf was sich die Aktivität bezieht)

Zusätzlich erfassen wir die Zeitpunkte von privaten Nachrichten, wobei die Inhalte dieser Nachrichten nicht gesammelt werden. Account-Namen werden anonymisiert, lediglich Links zu geteilten Videos werden erfasst.

Alle gesammelten Daten werden streng nach den Grundsätzen der Datensparsamkeit, Anonymisierung und Sicherheit verarbeitet. Die Teilnahme ist freiwillig und kann jederzeit widerrufen werden.

Baustein II: Umfrage – Selbstauskunft der Teilnehmenden

Neben den digitalen Verhaltensdaten aus den Datenspenden sammeln wir zudem Daten über einen standardisierten Online-Fragebogen. Diese Informationen dienen dazu, die Teilnehmenden in einen breiteren gesellschaftlichen Kontext einzuordnen, Methodenforschung zu betreiben, und Forschungsfragen zu beantworten, die über eine reine Analyse der Nutzungsdaten hinausgehen.

Der Fragebogen erfasst folgende Angaben:

  • Alter
  • Geschlechtsidentität
  • Postleitzahl (zur regionalen Zuordnung)
  • Bildungsabschluss

Diese Daten ermöglichen es uns, die Teilnehmer:innenpopulation zu beschreiben und beispielsweise zu untersuchen, ob bestimmte Altersgruppen, Bildungsabschlüsse oder Regionen verstärkt teilnehmen.

Darüber hinaus erheben wir:

  • Die Wahlentscheidung bei der aktuellen Wahl
  • Die Wahlentscheidung bei der letzten Landtags- und Bundestagswahl
  • Fragen zur digitalen Kompetenz (z. B. Verständnis für Algorithmus, Urteilsfähigkeit bei Online-Inhalten)
  • Die Wahrnehmung von TikTok im eigenen Medienkonsum, insbesondere hinsichtlich politischer Informationen und Nachrichten

Diese Angaben sind entscheidend, um zusammen mit den Verhaltensdaten Rückschlüsse auf die Rolle von TikTok bei der politischen Meinungsbildung ziehen zu können. Alle Angaben werden anonymisiert und DSGVO-konform gespeichert. Die Teilnahme ist freiwillig und jederzeit widerrufbar.

Baustein III: Inhalts- und Metadaten-Scraping

Die Daten aus den Datenspenden enthalten zwar Informationen darüber, was eine Nutzer:in getan hat (z. B. ein Video gesehen, geliked, geteilt), aber nicht, was für ein Video es war. Für eine tiefgehende Analyse von Inhalten – etwa: Welche Themen werden verbreitet? Welche politischen Positionen finden sich in Videos? – ist eine zusätzliche Anreicherung der Daten notwendig.

Daher werden für alle Videos, die im Rahmen der Datenspenden analysiert werden, zusätzliche Inhalts- und Metadaten gesammelt. (z.b., Veröffentlichungsdatum des Videos

  • Video-Beschreibung (Text)
  • Von TikTok zugewiesene Kategorie (z. B. „Politik“, „Aktuelles“, „Unterhaltung“)
  • Anzahl der Kommentare, Likes und Shares
  • Name des Accounts, der das Video veröffentlicht hat
  • Geografische Quelle (falls verfügbar)

Diese Anreicherung ermöglicht es uns, den inhaltlichen Kontext der Nutzer:innen-Aktivitäten zu verstehen. Die Daten werden ausschließlich für Forschungszwecke verwendet und unter strikter Einhaltung der Datenschutzbestimmungen verarbeitet.

Baustein IV: Live-Monitoring und Scraping politischer Inhalte

Neben den Videos, die durch die Datenspenden der Teilnehmenden erfasst werden, führen wir eine kontinuierliche, aktive Überwachung politischer Inhalte auf TikTok durch. Ziel ist es, ein zeitnahes Bild der politischen Kommunikation auf der Plattform zu erhalten – unabhängig von den Teilnehmenden.

Jeden Tag werden automatisiert neue Videos gesammelt, die entweder von offiziellen politischen Accounts veröffentlicht wurden, oder politische Schlüsselwörter (z. B. Hashtags, Begriffe) enthalten, die auf politische Themen verweisen.

  1. Offizielle politische Accounts
    Wir nutzen eine aufbereitete Liste von TikTok-Accounts von Politiker:innen und Parteien, die auf Basis der DBÖS (Datenbank Öffentlicher Sprecher) im Vorgängerprojekt zur BTW2025 erstellt wurde. Ergänzt wurde diese Liste durch eine manuelle Suche nach TikTok-Accounts von Politiker:innen und Parteien aus den drei untersuchten Landtagswahlen.
    Die vollständige Liste ist hier verfügbar: [Link wird in Kürze ergänzt]
  2. Politische Schlüsselwörter (Keywords)
    Für die Identifikation politischer Inhalte nutzen wir eine dynamisch aktualisierte Liste von Hashtags und Begriffen. Diese wird auf Basis der Liste des Projekts zur Bundestagswahl 2025 erstellt und durch Snowball-Sampling auf den kontinuierlich gesammelten Videos ab August 2026 an die Landtagswahlen 2026 angepasst.
    So werden regionale und landesbezogene Schlüsselwörter hinzugefügt. Die aktuelle Liste der genutzten Hashtags und Begriffe finden Sie hier: [Link wird in Kürze ergänzt]

Die Sammlung der Daten erfolgt über die offizielle TikTok Research API. Diese ermöglicht den Zugriff auf Metadaten und Video-Informationen – jedoch mit einer Verzögerung von ca. vier Tagen zwischen Video-Veröffentlichung und Datensammlung.

Baustein V: Klassifizierungspipeline – Inhaltsanalyse mit KI

Um eine tiefgehende, inhaltsbasierte Auswertung der gesammelten Videos zu ermöglichen – beispielsweise nach politischen Themen, Stimmungen oder Kommunikationsformen – setzen wir auf eine zweistufige, künstliche Intelligenz-gestützte Klassifizierungs-Pipeline.

1. Textbasierte Klassifizierung mit lokalem LLM (für Echtzeit- und Personalisierungszwecke)

Für eine schnelle und kontinuierliche Erkennung politischer Inhalte werden alle neu gesammelten Videos – insbesondere jene aus der letzten Woche pro Datenspende – zunächst mithilfe eines textbasierten, lokal laufenden Large Language Models klassifiziert. Dazu übermitteln wir dem Modell: den Video-Titel, die Video-Beschreibung, den Namen des Accounts, der das Video veröffentlicht hat.

Das Modell analysiert den Textinhalt und ordnet das Video einer oder mehreren politischen Themenkategorien zu (z. B. „Klimapolitik“, „Wahlkampf“, „Soziale Gerechtigkeit“).

Diese Klassifizierung dient zwei zentralen Zwecken:

  • Als Grundlage für den personalisierten Instant Report (siehe nächster Baustein), in dem Teilnehmende ihre eigene Nutzung im Kontext politischer Themen sehen können
  • Für die Live-Auswertung und öffentliche Visualisierung von Trends auf TikTok – beispielsweise in Echtzeit-Infografiken oder Dashboards

2. Multimodale Analyse mit InternVL – tiefgehende Inhaltsauswertung

Im zweiten Schritt wird jedes Video, das in den Datensätzen vorkommt, mithilfe einer multimodalen KI-Pipeline analysiert – basierend auf einem Modell, das sowohl visuelle als auch sprachliche Informationen verarbeitet.

Die Prozesskette sieht wie folgt aus:

  1. Video-Übermittlung: Das Video inklusive aller Metadaten (Titel, Beschreibung, Veröffentlichungszeit, Account) wird an das lokal laufende InternVL-Modell übermittelt.
  2. Multimodale Beschreibung: Das Modell generiert eine umfassende, natürlichsprachliche Beschreibung des Videos – inklusive visueller Elemente (z. B. Gesichtsausdrücke, Szenen, Videotexte).
  3. Thematische Keywords: Es extrahiert fünf thematisch relevante Stichwörter, die den Inhalt präzise charakterisieren.
  4. Frame-Extraktion: Aus dem Video werden fünf gleichmäßig verteilte Frames (z. B. zu Beginn, Mitte, Ende) automatisch ausgewählt und gespeichert – als visuelle Referenz.
  5. Transkriptgenerierung: Mit Whisper X wird ein Transkript des Audioinhalts erstellt.
  6. Video-Entfernung: Nach Abschluss der Analyse wird das ursprüngliche Video gelöscht – um die Datenspeicherung zu minimieren und den Datenschutz zu gewährleisten.

Baustein VI: Instant Analyse und Report

Der letzte Baustein unseres Projekts ist der personalisierte Instant Report – ein direkter, individueller Einblick in die eigene Nutzung von TikTok, speziell im Kontext politischer Inhalte. Er verbindet wissenschaftliche Tiefe mit Nutzer:innen-Transparenz und macht die Forschung sichtbar – für jede:r Teilnehmende.

Was ist der Instant Report?

Der Report zeigt Ihnen, was in Ihrem persönlichen TikTok-Feed passiert – ganz konkret:

  • Wie oft sehen Sie politische Inhalte?
  • Welche Themen dominieren in Ihrem Feed?
  • Wie vergleicht sich Ihre Nutzung mit der von anderen Teilnehmenden?
  • Welche Werte und Interessen scheinen in Ihren Videos besonders präsent zu sein?

Der Report ist in wenigen Sekunden verfügbar, sobald Ihre Datenspende verarbeitet wurde und ist ist – und bleibt vollständig anonym. Ihre Daten werden niemals an Dritte weitergegeben.

Wie wird der Report erstellt?

1. Datensynchronisation:
Die Video-IDs aus Ihrer Datenspende werden mit der zentralen Datenbank der bereits gesammelten und klassifizierten politischen Videos abgeglichen.

2. Anreicherung mit Inhalten:
Für jedes Video in Ihrem Feed werden automatisch:

  • Metadaten (z. B. Veröffentlichungsdatum, Kategorie)
  • Thematische Klassifizierungen (z. B. „Klima“, „Wahlkampf“, „Soziale Gerechtigkeit“)
  • Visuelle und sprachliche Inhaltsbeschreibungen (aus Baustein V)
  • Thematische Keywords hinzugefügt.

3. Analyse und Auswertung:
Auf einem sicheren Server werden Ihre Daten analysiert. Dabei werden:

  • Die Häufigkeit politischer Inhalte ermittelt
  • Themenprofile erstellt
  • Vergleiche mit der Gruppe der anderen Teilnehmenden (z. B. „Sie sehen 30 % mehr politische Inhalte als der Durchschnitt“)
  • Werte- und Interessenmuster identifiziert (z. B. „Ihr Feed zeigt starke Hinweise auf Umwelt- und Gerechtigkeits-Themen“)

Warum ist das wichtig?

Der Instant Report ist mehr als nur eine Statistik:

  • Er macht für Teilnehmende sichtbar, wie algorithmische Systeme politische Inhalte verteilen – und warum sie manche Themen sehen, andere nicht.
  • Er ermöglicht Reflexion: Teilnehmende können ihre eigene Medienwelt besser verstehen – und über die Rolle von TikTok in ihrer politischen Bildung nachdenken.
  • Er stellt Forschung in Beziehung zur Lebenswelt: Die Ergebnisse zeigen Aspekte der Forschung, die nicht nur für Wissenschaftler:innen relevant – sondern auch für Sie, die Teilnehmenden.

Zusammenfassung

Der Instant Report ist der Mittelpunkt der Nutzer:innen-Partizipation in unserem Projekt. Er verbindet:

  • Transparenz (was passiert mit Ihren Daten?)
  • Personalisierung (was passiert in Ihrem Feed?)
  • Forschungstiefe (was bedeutet das für die Gesellschaft?)
  • Ethik und Datenschutz (Ihre Daten bleiben sicher und anonym)