Vor rund einem Jahr beklagte ich im Tagesspiegel Background die ungenügende Datenbasis, auf Grundlage derer in der Corona-Politik Entscheidung getroffen werden und Medien die Öffentlichkeit informieren. „Würden alle Kliniken in allen betroffenen Ländern ihre Corona-Tests so genau digital dokumentieren, wie es mittlerweile jeder Berliner Späti für den Verkauf eines Schokoriegels tun muss”, schrieb ich damals, könnten wir einige eklatante Wissenslücken schließen, die die Effektivität der Anti-Corona-Maßnahmen und Genauigkeit von Vorhersagemodellen reduzieren. Auch plädierte ich für eine regere Diskussion zum Thema Vorhersagemodelle, Datenerhebung und Umgang mit Daten in Krisenzeiten. Denn ein weiteres Problem ist die fehlende Reife der Öffentlichkeit beim Umgang mit datenbasierten Modellen.
Mangel an Zahlenverständnis
Hier – und bisher leider auch nur hier – hat sich nach einem Jahr tatsächlich Einiges getan. So machte Anfang Mai in etwa das heute-journal des ZDF das Datenproblem zu einem Hauptthema. In der Sendung wurde der bekannte Medizinstatistiker Gerd Antes gefragt, warum wir hierzulande eigentlich auf eine so unerklärliche Weise versäumen, relevante Pandemie-Daten zu sammeln. Erstens, antwortet Antes sinngemäß, haben wir nicht gelernt mit Zahlen umzugehen, und zweitens glaubt die Politik mangels Vertrauen in die Wissenschaft, „die Dinge auch ohne die entsprechenden Zahlen regeln zu können“. Zudem missbrauche die Politik den Datenschutz regelrecht als „Abwehrmaßnahme“ gegen eine bessere Datenerhebung. Die Pandemie erfordere es jedoch, die Spielräume voll ausnutzen, die das Bundesdatenschutzgesetz hergibt.
So befinden wir uns auch über ein Jahr nach den ersten Lockdowns im Corona-Blindflug. Was erklärt die hohen Fallzahlen in Bayern (trotz vergleichsweise harter Maßnahmen) gegenüber der geringen Inzidenz in Schleswig-Holstein? Wie lange sind Genesene eigentlich immun? Wie viele Zahnärzte, die berufsbedingt einem besonders hohem Risiko ausgesetzt sind, haben sich angesteckt, wie viele mussten intensiv behandelt werden? Wir können viele Fragen aufgrund der löchrigen Datenbasis nicht beantworten. Dabei brauchen wir eben diese Antworten, um wichtige Lehren für die nächste Pandemie zu ziehen. Mithilfe auf Künstlicher Intelligenz (KI) basierender Vorhersagemodelle könnten wir künftig Pandemien erfolgreicher bewältigen, doch die Voraussetzung dafür ist eine ausreichende Datenbasis. Und auch ein reiferer Umgang mit ihr.
Wege aus der Datenkrise
Es ist höchste Zeit und auch noch lange nicht zu spät, unser Datenproblem aktiv anzugehen. Inzidenzen werden dank immer besserer Impfstoffversorgung sinken und Lockerungen werden kommen, doch neue Corona-Mutationen werden uns voraussichtlich noch eine lange Zeit auf Trab halten. Darum brauchen wir eine bessere Datenbasis und ein besseres Verständnis dieser Daten seitens der Öffentlichkeit. Wie erreichen wir das? Hier einige konkrete Anreize.
Wenn es um Datenerhebung geht, können wir uns vor allem von den Briten eine Scheibe abschneiden. Ein großer Teil des Wissens über das Virus und die Wirksamkeit der Anti-Virus-Maßnahmen wird im Vereinigten Königreich generiert – vor allem auf Basis kontinuierlicher, repräsentativer und vergleichbarer Stichproben.
Folglich werden in den wöchentlich aktualisierten National Influenza and COVID-19 Surveillance Reports die Briten deutlich umfangreicher als wir über den Pandemieverlauf und Erfolg der Anti-Pandemiemaßnahmen informiert. So etwa auch über die Verbreitung von Covid-19-Antikörpern (die Erhebung dieser Daten gibt zudem Aufschluss über die Verbreitung der unterschiedlichen Mutationen) unter der Bevölkerung oder über die nach Berufsgruppe gefilterten Todeszahlen. Auf der offiziellen COVID-Insights-Webpage der britischen Regierung lassen sich die wichtigsten Daten inklusive der Krankenhauseinweisungen interaktiv erfassen. Warum kann nicht auch Deutschland so viele wissensgenerierende Monitoringstudien durchführen und pandemierelevante Erkenntnisse der Öffentlichkeit so gut präsentieren wie die Briten?
Corona-Datenplattform sinnvoll nutzen
Wir müssen auch in Deutschland mehr darüber wissen, welche Menschen genau in die Krankenhäuser kommen, wie viele von ihnen ins Krankenhaus eingewiesenen intensiv behandelt werden müssen und wie viele von ihnen sterben. Wir müssen so viel in Erfahrung bringen, wie es unser zurecht starker Datenschutz eben hergibt. Warum schlüsseln wir die Inzidenzen in vielen Städten immer noch nicht nach der Postleitzahl auf, um besser zu verstehen, wo genau sich Corona am schnellsten verbreitet und warum? Bei jedem Schnelltest müssen wir unsere PLZ sowieso angeben – und doch bleiben diese Daten vielerorts unbenutzt.
Alle Daten müssen vergleichbar gemacht und in die im Dezember gestartete Corona-Datenplattform des Bundesministeriums für Wirtschaft und Energie (BMWi) fließen. Dort müssen die Experten diese Daten letztendlich zusammen betrachten und in einen sinnvollen Bezug zueinander setzen können – ungefähr so, wie es Vertriebs-Fachleute mit einem Verkaufstrichter tun. Und dann bekommen wir Antworten auf die offenen Corona-Fragen ein ganzes Stück näher.
Auch Medien müssen Lehren ziehen
Kommen wir zum Problem des Umgangs mit Zahlen. Leider schließt das Problem auch die Medien mit ein. Ein gutes Beispiel dafür: die Reaktion auf einen Tweet von Jan Böhmermann, dessen Ziel es ursprünglich war, die #allesdichtmachen-Kampagne zu kritisieren. In diesem hob der Entertainer schlicht und einfach den gewaltigen Unterschied zwischen den Inzidenzen im Kölner Villenviertel Hahnwald (0 zum Zeitpunkt des Tweets) und den sozialen Brennpunkten Chorweiler und Lind (beide weit über 500) hervor. Damit trat er eine Debatte zum Zusammenhang zwischen Wohn- und Lebensverhältnissen und Covid-Verbreitung los. So weit, so gut. Der Ausgangspunkt hätte aber nicht der Tweet eines Prominenten, sondern eine fundierte journalistischer Analyse sein müssen.
Doch dafür müssen Journalisten aufhören, die immer gleichen Floskeln zu wiederholen und sich zumindest die Daten, die da sind, mal genauer anschauen. Und sie so differenziert betrachten, wie sie sind. So sind die berühmt-berüchtigten Inzidenzzahlen vom Wochenende auch nicht weniger „aussagekräftig” als Wochentags-Zahlen, wie es die irreführende Floskel uns immer wieder weismachen will. Nicht zuletzt hätten Medien schon früher nicht nur Virologen, sondern auch Empirikern wie Mathematikern, Statistikern oder Soziologen mehr Aufmerksamkeit schenken können und sollen.
Gerade die Medien müssen darum die nötigen Lehren ziehen und beim Umgang mit Zahlen mit gutem Beispiel vorangehen.
Der Spezialist für Datenanalysen Lars-Alexander Mayer ist Geschäftsführer von TD Reply.