Der Kampf gegen Krebs hat in den letzten Jahrzehnten unglaubliche Fortschritte gemacht. Beispiel Brustkrebs: Die Chancen einer Frau, zehn Jahre nach der Diagnose zu überleben, hat sich in den letzten 50 Jahren verdoppelt – dank neuer Medikamente, modernster Screening-Methoden und weniger invasiver, dafür effektiverer Operationen.
Doch für die nächste weitreichende Evolution bei der Behandlung brauchen wir ein noch detaillierteres Verständnis der individuellen Krankheit jedes einzelnen Patienten. Jede Krebserkrankung ist anders. Selbst verschiedene Tumore derselben Krebsart sprechen oft völlig unterschiedlich auf Behandlungen an. Ärzte müssen sich noch zu häufig auf pauschale Behandlungsoptionen verlassen, statt auf eine Präzisionsmedizin bauen zu können, die auf die individuellen Bedürfnisse ihrer Patienten zugeschnitten ist. Wir müssen in die Lage kommen, die Frage, warum manche Krebspatienten gut auf bestimmte Medikamente ansprechen, andere dagegen nicht, besser beantworten zu können. Das erfordert eine detaillierte Analyse der Patientendaten.
Beste KI ohne entsprechende Datenqualität nutzlos
Künstliche Intelligenz spielt hier eine entscheidende Rolle, da sie schnell und zuverlässig entscheidende Muster erkennen kann, die für das menschliche Auge möglicherweise nicht sichtbar sind. Wichtigste Voraussetzung dafür ist der Zugang zu großen Mengen hochwertiger Daten, um eine entsprechende Datenqualität zu gewährleisten. Sonst ist die beste KI nutzlos. Ein erstklassiger Algorithmus ohne Daten ist sonst wie ein Ferrari mit leerem Tank – er kommt nicht vom Fleck. Allerdings ist es in der medizinischen Welt schwieriger, das benötigte „Benzin“ in ausreichender Menge und Qualität zu beschaffen.
In den meisten Branchen sind Daten in der Regel sterile Zahlen in einer Tabelle. In der medizinischen Forschung allerdings sind Daten beispielsweise Bilder des Krebstumors eines Patienten, detaillierte Informationen über seine genomische Beschaffenheit, Ergebnisse von Labortests und individuelle Informationen oder Besonderheiten zum Patienten selbst. Kurz gesagt, es handelt sich um riesige Datenmengen, und gleichzeitig um die sensibelsten und privatesten Informationen der Welt. Zur Einordnung: Bei einem einzigen Krankenhausaufenthalt können bis zu 150.000 einzelne Daten anfallen. Trotzdem verfügen KI-Forscher seit Jahren über verhältnismäßig wenige Daten – Patienten, Ärzte und Pharmaunternehmen zögern, sie weiterzugeben.
Diese medizinischen Daten befinden sich größtenteils in Silos – in Universitäten, Pharmaunternehmen und Forschungsinstituten. Datenschutz, mögliche Sicherheitsrisiken und Wettbewerbsbedenken haben in der Vergangenheit hohe Hürden für die Zusammenarbeit in der Forschung gesetzt. Das hemmt maßgeblich die Entdeckung neuer Behandlungsmethoden, die Entwicklung fortschrittlicherer Diagnoseinstrumente und die Erzielung grundlegender wissenschaftlicher Durchbrüche – und macht all das teuer wie langwierig. Im Durchschnitt kostet die Entwicklung eines Medikaments zwischen ein bis zwei Milliarden US-Dollar und dauert bis zu zehn Jahre.
Föderiertes Lernen: Daten bleiben lokal gespeichert
Aber es tut sich was: Der Ansatz des föderierten Lernens versetzt Forscher nun in die Lage, die Hemmschwellen und Herausforderungen zu überwinden und endlich mit einem kollaborativen Ansatz in der KI-gestützten Krebsforschung vielleicht die entscheidenden Impulse zu setzen. Föderiertes Lernen ist ein Machine-Learning-Ansatz, der das Trainieren hochwertiger, über mehrere Krankenhäuser oder unabhängige Zentren verteilte Modelle ermöglicht. Anstatt die Daten auf einem einzigen zentralen Server zu sammeln, bleiben die Daten für die Projektdauer lokal auf den Klinik-Servern gespeichert. Lediglich die Algorithmen und Vorhersagemodelle werden zwischen den Servern ausgetauscht.
Als Unternehmen haben wir es uns zur Aufgabe gemacht, auf Basis dieser Technologie, eine Plattform und ein Datennetzwerk zu schaffen, welches das weltweit größte und sicherste Netzwerk von Krankenhäusern und Forschungszentren mit hochwertigen, multimodalen Datensätzen umfasst. Es ist eine Plattform mit einer kollektiven Intelligenz entstanden, die Data-Science-Projekte mit anonymisierten oder pseudonymisierten Patientendaten ermöglicht und gleichzeitig den Datenschutz und die Sicherheit wahrt.
EU-Projekte nutzen föderiertes Lernen
Föderiertes Lernen als KI-Framework ist eine Lösung, um medizinische Forschung und die Entwicklung von Medikamenten langfristig zu verbessern. Erste richtungsweisende Projekte zeigen die Möglichkeiten auf, die in dieser Form der Zusammenarbeit stecken – beispielsweise das europäische Projekt MELLODDY. Dieses ermöglicht es zehn Pharmaunternehmen, ihre wertvollen Daten zur Arzneimittelforschung kollaborativ zu nutzen, ohne geschützte Informationen preiszugeben, und somit genauere, schnellere und kostengünstigere KI-Modelle zu trainieren. Oder OPTIMA – das Konsortium ermöglicht es 36 Forschungspartnern, darunter Krankenhäuser, Universitäten und Pharmaunternehmen, Erkenntnisse aus den Daten von 200 Millionen Krebspatienten zu gewinnen. So etwas hat es in dieser Größenordnung noch nicht gegeben. Das HealthChain-Projekt ermöglicht es Krankenhäusern, gemeinsam KI-Modelle für Krebs, Pathologie und Fruchtbarkeit zu entwickeln, ohne dass die Daten-Pools die jeweiligen Klinik-Server verlassen.
Allein im Jahr 2020 sind schätzungsweise 2.300 Exabyte gesundheitsbezogener Daten erfasst worden – 15-mal so viel wie noch vor zehn Jahren. Nur die KI ist in der Lage, in dieser Datenmenge die Informationen zu finden und herauszufiltern, in denen potenzielle medizinische Durchbrüche verborgen sind. Bisherige Datenschutz- und Sicherheitsbedenken sind verständlich, KI-Frameworks wie das föderierte Lernen bieten allerdings eine Lösung, die den Schutz der Privatsphäre und die Datensicherheit sehr ernst nehmen und berücksichtigen. Es gilt diese Lösungen im gesamten Gesundheitssektor zunehmend zu implementieren – für schnellere Erkenntnisse, die eine individuellere Behandlung von Krebspatienten ermöglichen.
Thomas Clozel ist Co-Founder und CEO von Owkin.