Seit einigen Tagen kann die Corona-Warn-App QR-Codes scannen. Damit sollen händisch Cluster erkannt und alle Teilnehmer:innen im Infektionsfall gewarnt werden. Technisch wäre auch eine Automatisierung des Vorgangs möglich. Dadurch könnte die Risikoermittlung der App deutlich verbessert und Nutzungsfehler oder gar Missbrauch vermieden werden.
Aktuell erfolgt die Risikoermittlung anhand eines Eins-zu-eins-Kontakts. Die Gesamtbewertung, ob also die Kachel grün (niedriges Risiko) oder rot (erhöhtes Risiko) wird, kann von einer Einzelbegegnung oder der Summe von Einzelbegegnungen abhängen. Bei der individuellen Risikobetrachtung wird aber nicht das Setting betrachtet, also die Begleitumstände eines Kontakts mit einer nachträglich positiv getesteten Person. Vereinfacht gesagt: Die App weiß nicht, ob sich die Personen einzeln oder in einer Gruppe, drinnen oder draußen, sitzend oder beim Spazierengehen getroffen haben.Manuelle Clustererkennung ist kein technischer Fortschritt
Die manuelle Clustererkennung, die seit Anfang Mai in der Corona-Warn-App verfügbar ist, versucht dieses Problem händisch zu lösen. Bestimmte Örtlichkeiten, wie zum Beispiel Restaurants, bieten einen QR-Code an, der beim Betreten durch die Corona-Warn-App eingelesen wird. Dieser QR-Code wird an eine Zeitspanne gekoppelt. Ein Gast, der später positiv getestet wird, kann innerhalb der Corona-Warn-App eine Warnung auslösen, die alle Personen, die im ähnlichen Zeitraum in der Location eingecheckt waren, warnt. Die Warnung erscheint als grüne Warnung, wenn sich die beiden Zeitfenster bis zu 10 Minuten überschneiden. Ansonsten wird die Warnmeldung rot.
Die manuelle Clustererkennung ist, streng genommen, die Übertragung eines manuellen Vorgangs in die digitale Welt: Statt mich mit Stift und Zettel in eine Liste einzutragen, scanne ich einen QR-Code. Unbestritten: Die Lösung per Corona-Warn-App geht schneller und ist datenschutzfreundlicher – aber eben alles andere als perfekt. Beim Check-in lässt sich eine Zeit für einen automatischen Check-out definieren, der aber nicht der Realität entsprechen muss. Auch ein manuelles Check-out vergessen vermutlich viele schnell. Außerdem ist die manuelle Clustererkennung ungenau: ein QR-Code kann für einen kleinen Imbiss gelten oder auch für ein mehrstöckiges Edel-Restaurant. Theoretisch können natürlich auch QR-Codes für jeden Restaurant-Bereich definiert werden. Ob das in der Praxis aber der Fall sein wird, ist mehr als fraglich.
Technologisch gesehen ist die manuelle Clusterkennung ein Schritt rückwärts. Ein großer Vorteil der Corona-Warn-App ist ja, dass sie nach der Installation (zumindest theoretisch) nicht mehr aufgerufen werden muss, bis möglicherweise irgendwann per Push-Meldung eine Warnung erscheint. Oder wie ein großer Technologiekonzern gern sagt: It just works.
Automatische Clustererkennung verbessert Risikoermittlung deutlich
Bei der automatischen Clustererkennung steht diese Überlegung im Vordergrund: Wie kann die Risikoberechnung verbessert werden, ohne dass irgendeine Handlung der Nutzer:innen erforderlich ist? Wie können Cluster, also Menschenansammlungen, automatisch erkannt werden? Wie kann dadurch die Risikoberechnung verbessert werden?
Wie bereits erwähnt, basiert die Risikoberechnung der Corona-Warn-App auf Einzelkontakten. Diese Kontakte werden in Zeitdauer, Abstand (Dämpfung des Bluetooth-Signals) und einer Kombination aus Symptomen und Tag der Infektion der Kontaktperson berechnet. Die Berechnung erfolgt immer in einem Eins-zu-eins-Szenario.
Jedes moderne Smartphone ist mit einer Vielzahl von Sensoren ausgestattet. Für die Berechnung des Exposure Notifcation Frameworks (die Grundlage der Corona-Warn-App) wird jedoch nur Bluetooth benutzt. Zwar ist eine Abstandsmessung per Bluetoothsignalstärke nicht perfekt, als Indikator für die Risikoermittlung dennoch ausreichend genau.
Bei der automatischen Clustererkennung müssten mehr Daten gespeichert werden, allerdings ohne das hohe Datenschutzniveau der Corona-Warn-App aufzuweichen. Die verbaute Technik der Smartphones lässt jedoch viel mehr zu, sodass auch die folgenden Datenquellen in die Risikoberechnung aufgenommen werden könnten:
- Anzahl Bluetooth-Signale des Exposure Notifcation Frameworks: Bei der Berechnung des Risikos spielt dies eine große Rolle. Fand der Kontakt mit einer Person in einer Eins-zu-eins-Situation statt oder in einer Menschenmenge? Bleibt die Anzahl der Signale über eine längere Zeit gleich hoch, ist beispielsweise von einer Clustersituation auszugehen.
- Anzahl weiterer Bluetooth- und WLAN-Signale: Da nicht jede:r die Corona-Warn-App nutzt, könnte generell auch die Anzahl aller Bluetooth-Signale (möglicherweise kategorisiert nach Signalstärke) in einem Datensatz gespeichert werden. Ähnliches gilt für WLAN. Selbstverständlich sollen keine Identifizierungsinformationen der Signale (MAC) gespeichert werden. Es reicht schlicht die Anzahl.
- Mit WLAN verbunden ja/nein: Die Information, ob das Gerät zum Kontaktzeitpunkt mit einem WLAN verbunden war, kann dabei helfen, einzuschätzen, ob der Kontakt in einem Raum oder an der frischen Luft stattfand (WLAN-Verbindung eher unüblich). Die Berechnung des Risikos kann daher deutlich höher ausfallen, wenn eine WLAN-Verbindung zum Kontaktzeitpunkt vorlag. Selbstverständlich werden keine Informationen zum Netzwerk gespeichert, sondern nur, ob eine Verbindung vorlag oder nicht.
- In Bewegung ja/nein: Smartphones verfügen über Bewegungssensoren, die beispielsweise als Schrittzähler dienen. Diese Bewegungssensoren sind nicht mit GPS zu verwechseln; eine Bestimmung des Ortes ist somit nicht möglich. Andererseits kann aber gespeichert werden, ob ich mich in Bewegung befand und sogar welche Art Bewegung dies war. iPhones können beispielsweise automatisch erkennen, ob der/die Nutzer:in gerade Rad fährt, zu Fuß geht oder mit einem Fahrzeug unterwegs ist.
- Signalstärke Mobilfunk: Die Signalstärke des Mobilfunks kann zusätzlich Informationen geben, in was für einer Umgebung sich das Gerät befand und ob es in Bewegung war. Sprich: ob die Signalstärke zwischen den Zeitpunkten variiert.
Ein einfaches Beispiel für die automatische Clustererkennung ist der Besuch in einem Restaurant. Das Smartphone erkennt, dass es zwei Stunden nicht bewegt wurde und möglicherweise im Restaurant-WLAN eingeloggt war. 20 andere Signale wurden über den Zeitraum ermittelt. Hier könnten alle oben genannten Datenpunkte herangezogen werden. Die Anzahl der Signale ist ungefähr gleich hoch, alle sind mit dem WLAN verbunden, es gibt keine Bewegung und eine identische Mobilfunk-Signalstärke. Es lag eine Clustersituation vor und es kann eine Risikomeldung auf vielen Mobiltelefonen erscheinen, obwohl der direkte Abstand zu einer positiv getesteten Person im klassischen Modell nie eng genug für eine Meldung gewesen wäre.
Dies sind nur einige mögliche Datenpunkte von weiter denkbaren. Bei jedem dieser Vorschläge sollte selbstverständlich vorab eine Folgenabschätzung erstellt werden, ob durch diese Informationen der Datenschutz so weit eingeschränkt wird, dass das hohe Niveau verlassen werden könnte.Apple und Google sind gefragt
Der große Vorteil der automatischen Clustererkennung liegt auf der Hand: Es bedarf keines Scans eines QR-Codes und die Risikoberechnung kann deutlich mehr Informationen einbeziehen – und das unter Berücksichtigung des hohen Datenschutzniveaus und ohne Identifizierung von Ort oder Person.
Die automatische Clustererkennung kann nicht allein von der Deutschen Telekom und SAP, den beiden Firmen hinter der Corona-Warn-App, eingeführt werden. Die App basiert auf dem Exposure Notification Framework, das die Betriebssystemhersteller Apple und Google im Frühjahr 2020 als Reaktion auf die Pandemie vorgestellt haben. Die Betriebssystemhersteller nutzen diese Daten für eigene Dienste permanent und müssten sie lediglich für das Framework freischalten. Damit das hohe Datenschutzniveau, mit dem beide US-amerikanische Unternehmen werben, erhalten bleibt und die Risikoberechnung deutlich verbessert werden kann, wird es höchste Zeit, dass eine entsprechende deutsche Initiative gestartet wird. Erste Ideen dazu liegen nämlich bereits seit dem Spätsommer 2020 auf dem Tisch.
Henning Tillmann ist Diplom-Informatiker, selbstständiger Softwareentwickler und lebt in Berlin. Er ist Co-Vorsitzender des digitalpolitischen Thinktanks D64 – Zentrum für digitalen Fortschritt.