Künstliche Intelligenz kann Krebsrisiko vorhersagen
Niemand weiß genau, wer einmal Krebs bekommt. Forschende haben nun ein verlässliches Vorhersagemodell entwickelt, das das Krebsrisiko einer Person anhand bestimmter Angaben individuell schätzen kann.
Die „risikoadaptierte Früherkennung“ ist eine neue Form der Vorsorge. Je nachdem wie gefährdet eine Person für eine Krankheit ist, wird ihr eine andere Art von Früherkennungsuntersuchung angeboten. Das hat viele Vorteile: Menschen, bei denen eine Erkrankung höchstwahrscheinlich gar nicht auftreten wird, kann man dann die Belastungen durch eine Maßnahme möglicherweise ersparen. Andere, die dagegen ein hohes Risiko haben, können Untersuchungen in früherem Lebensalter oder engeren Abständen oder mit einer speziell auf sie ausgerichteten Methode angeboten werden. Das setzt allerdings voraus, dass man das Risiko eines Menschen verlässlich ermitteln kann.
Dafür hat ein Team aus Datenwissenschaftlerinnen und -wissenschaftlern des Deutschen Krebsforschungszentrums (DKFZ) und des britischen Standorts des Europäischen Bioinformatik-Instituts (EMBL) ein digitales Vorhersagemodell entwickelt. Mithilfe von künstlicher Intelligenz kann es das individuelle Risiko einer Person für 20 Krebsarten mit hoher Genauigkeit abschätzen.
Modell bauen und mit Daten aus Gesundheitsregistern füttern
Am Anfang stand die wissenschaftliche Literaturrecherche nach Faktoren, die Einfluss auf die Krebsentstehung haben – Genetik, Familiengeschichte, Lebensstil und Gesundheitsfaktoren. Daraus entstanden Algorithmen, auf denen das Modell basiert.
Das Modell fütterten die Forschenden mit Patientendaten aus ausgewählten Ländern mit Gesundheitsregistern. In solchen Registern erfassen unter anderem Dänemark und Großbritannien, wenn eine Einwohnerin oder ein Einwohner in einem Krankenhaus oder einer Arztpraxis behandelt wird. Auch Informationen zur Gesundheitsgeschichte der Familie – z. B. gehäuftes Auftreten von Krebs – lassen sich aus den verfügbaren Daten rekonstruieren. Für einen Teil der Bevölkerung können Krebs begünstigende Faktoren wie Rauchen, Alkoholkonsum oder Übergewicht aus hinterlegten Informationen gewonnen werden; dies wird jedoch nicht systematisch erfasst.
Zum Einlernen nutzte das Team Aufzeichnungen aus Dänemark, und zwar aus dem Dänischen Nationalen Patientenregister, dem Krebsregister, dem Sterberegister und Behandlungsakten von Niedergelassenen aus den Jahren 1995 bis 2014. Sie ließen sich hier nur Erwachsene anzeigen, die zwischen 16 und 86 Jahren alt waren und zu Beginn der Erfassung noch nie eine bösartige Krebserkrankung hatten. Damit vermieden die Forschenden die Verfälschung der Ergebnisse, da Menschen, die bereits einmal Krebs hatten, mit erhöhter Wahrscheinlichkeit einen Zweitkrebs entwickeln. Denn das Ziel war es, das Modell auf die Erkennung des Krebsrisikos bei bislang nicht Betroffenen einzulernen.
Künstliche Intelligenz lernt typische Risikomuster aufzudecken
Mit den Informationen, welche Personen im Laufe des Lebens häufiger an Krebs erkrankten oder starben als andere, lernte das Modell mehr über typische Muster von gefährdeten Personen. Die Datenwissenschaftlerinnen und -wissenschaftler testeten dann anhand von Daten der Dänischen Register aus den Jahren 2015 bis 2018, ob das Tool Krebs verlässlich vorhersagen konnte. Um die Übertragbarkeit ihres Vorhersagemodells auf andere Gesundheitssysteme zu überprüfen, setzten sie es auch an Daten der britischen UK Biobank ein. Mit Erfolg: Beide Validierungstests zeigten eine sehr gute Treffsicherheit.
Der beteiligte Professor Dr. Moritz Gerstung, Leiter der Abteilung „Artificial Intelligence in Oncology“ am DKFZ, hebt hervor: „Unsere Machbarkeitsstudie hat gezeigt, dass man Risikogruppen mittels standardisierter Daten zu Vorerkrankungen, Lebensstil und auch Krebsfällen im Familienkreis identifizieren kann. Allerdings waren Daten zu bekannten Risikofaktoren, wie Rauchen oder Alkoholkonsum, nicht Teil der Register und konnten nur für einen geringen Teil der Patienten erfasst werden. Dies beeinträchtigte die Treffsicherheit des Modells.“
KI kann helfen – wenn die richtigen Daten zu Verfügung stehen
Die Arbeit hat gezeigt, dass KI, die mit digitalen Gesundheitsregistern geschult wird, geeignet ist, Personen mit erhöhtem Krebsrisiko zu identifizieren. Das könnte helfen, eine Risikoadaptierung aktueller Screenings vorzunehmen und den Nutzen der Programme damit zu verbessern.
Noch sind Gesundheitsregister wie in Dänemark nicht flächendeckend in anderen Ländern verfügbar. Das deutsche Gesundheitsdatennutzungsgesetz, welches am 26.03.2024 in Kraft trat, schafft hierfür auch in Deutschland den rechtlichen Rahmen für den Aufbau ähnlicher Datenbanken. Nur eine umfassende und geeignete Datengrundlage ermöglicht gute Forschungsergebnisse. Daher sollte aus Sicht von Professor Gerstung bei Einführung eines vergleichbaren Registers in Deutschland die Erhebung von Daten zu Lebensstil-bedingten Risikofaktoren (Rauchen, sportliche Betätigung oder Körpergewicht) von Anfang an mitgedacht werden.