Datenjournalismus

Blog über unser Datenjournalismus-Projekt DebateExplorer, November 2016

Auf der Wissenswerte, der Konferenz für Wissenschaftsjournalismus, präsentieren wir in einem Werkstattgespräch am Dienstag, 29.11., erste Ergebnisse unseres DebateExplorers: Können Maschinen Semantik verstehen, können sie sogar angesichts der verklausulierten Sprache der Politiker Muster in Bundestagsdebatten finden und uns Journalisten auf Auffälligkeiten stoßen, die wir ohne maschinelle Unterstützung nicht gefunden hätten? Unser Projekt auf der Basis der Förderung der Volkswagenstiftung im Projekt „Wissenschaft und Datenjournalismus“ erkundet seit Januar 2016 die Grenzen der Wissenschaft und versucht, sie zu verschieben. Wir wollen mit euch unsere Erfolge und die künftigen Herausforderungen diskutieren.

Unser Tool soll gerade in Zeiten knapper Mittel im Journalismus dafür sorgen, dass investigative Recherche nicht nur den großen Verlagen vorbehalten bleibt oder angesichts des Aufwands ganz ausstirbt. Wir nutzen öffentlich zugängliche Texte wie Bundestagsdebatten, Interviews und Artikel, um mittels automatischer Texterkennung aufzudecken, wie Debatten beeinflusst werden. Die Herausforderung dabei: die Algorithmen sollen nicht nur wortgleiche Passagen finden, sondern auch inhaltliche Gemeinsamkeiten, die verschieden formuliert sind. Dafür trainieren wir sie gemeinsam: JournalistInnen und ComputerlinguistInnen.

Es ist nicht einfach, den Maschinen ein Verständnis menschlicher Sprache nahe zu bringen. Aber wir sind überzeugt, dass das Team Hirn und Algorithmus unschlagbar ist und den investigativen Journalismus vorantreibt. Das wollen wir im Rahmen des Werkstattgesprächs auf der Grundlage unserer Erfahrungen mit euch diskutieren und gemeinsam in die Zukunft blicken. Unser Ziel ist ein Tool, das JournalistInnen in Zukunft nutzen können, um die Beeinflussung von Debatten zu untersuchen. Wir sind überzeugt davon, dass diese Art der Datenauswertung und des Textmining die Zukunft des (Daten)Journalismus ist und dass wir diese erreichen können, wenn wir untereinander und mit Wissenschaftlern kooperieren und unsere Ergebnisse sowie den zugehörigen Code zum Nutzen aller veröffentlichen.