Mit mehr Daten besser behandeln
Bösartige Nierentumoren gehören zu den seltensten Krebsarten. Sie sind in vielen Fällen tödlich. Dank moderner Bildgebungsverfahren werden die Tumoren zwar früh erkannt, doch die Wahl der passenden Therapie ist oftmals schwierig. Eine bessere Datenlage könnte helfen.
Tumoren, die in Nierenzellen entstehen können, sind sehr unterschiedlich – von gutartigen Gewächsen und Zysten bis hin zu aggressiven Karzinomen. Deshalb ist es oft schwierig, die richtige Entscheidung für die Behandlung und Prognosen zur Entwicklung des Tumors treffen zu können.
Mehr Informationen durch Bilddaten können hier helfen. Das ist insbesondere bei lebensbedrohlichen Nierenzellkarzinomen relevant, aber auch für die angemessene Behandlung gutartiger Tumoren. Deshalb hat ein interdisziplinäres Forscherteam das Projekt „SchWArmlernen und Generative Modelle zur Synthese und Nutzbarmachung hochqualitativer Daten in der Krebsmedizin“ – kurz SWAG – ins Leben gerufen. Es wird im Rahmen der Richtlinie zur Förderung von interdisziplinären Projekten zur Entwicklung und Erprobung von neuen Ansätzen der Datenanalyse und des Datenteilens in der Krebsforschung in der Nationalen Dekade gegen Krebs gefördert. Die Medizinerinnen und Mediziner der Universitätskliniken in Würzburg, Aachen und Dresden sowie der Universitätsmedizin Mainz arbeiten eng mit Informatikerinnen und Informatikern der Universitätsklinik Heidelberg zusammen.
Größere Datenmengen durch Schwarmlernen
Momentan gibt es nur wenige Daten von Patientinnen und Patienten mit Nierentumoren, wie zum Beispiel Röntgen- und Computertomographie-Aufnahmen oder histologische Befunde. Zudem sind diese meist nur auf eine Klinik bezogen und es handelt sich um sehr sensible Patientendaten, die einem besonderen Schutz unterliegen. Mit dem sogenannten Schwarmlernen lassen sich diese Hindernisse überwinden. Das Verfahren beruht auf Künstlicher Intelligenz (KI) und verfolgt einen dezentralen Ansatz. Es wird kein zentraler Server benötigt. Statt Daten zusammenzuführen, bleiben sie in den Kliniken, wo sie erhoben wurden. Ausgetauscht werden nur Algorithmen und das, was sie an jedem Standort dazulernen – etwa bestimmte Gewächse in Nierenzellen besser zu erkennen. Die Algorithmen bewegen sich durch Datensätze an verschiedenen Standorten und trainieren auf diese Weise mit größeren Datenmengen. So können sie Erkrankungen später anhand bestimmter Parameter mit hoher Sicherheit erkennen und bei Therapieentscheidungen unterstützen.
Künstlich und gleichzeitig realistisch
Ziel des Projektes SWAG ist ein Modell, das aus den ursprünglich sensiblen Patientendaten realistische synthetische Daten erzeugt. „Wir werden zeigen, wie synthetische medizinische Bilddaten in einem kollaborativen Ansatz mehrerer Partner durch Schwarmlernen erzeugt werden können“, sagt Projektleiterin Bettina Baeßler vom Universitätsklinikum Würzburg. Die Kombination von synthetischen Daten und föderiertem Lernen vereinfacht den Zugang zu medizinischen Daten. Föderiertes Lernen ist eine Methode, die maschinelles Lernen mit Datenquellen aus unterschiedlichen Standorten ermöglicht. So können zum Beispiel Bilddaten aus mehreren Kliniken genutzt werden. Die erzeugten synthetischen Daten sind frei von Datenschutzbeschränkungen und Eigentumsansprüchen von Interessensgruppen. Sie lassen sich dann für die Entwicklung von KI-Algorithmen, die mit echten Daten arbeiten, frei teilen. So können die Ergebnisse von SWAG den Bereich der medizinischen KI-Entwicklung maßgeblich vorantreiben.
Erst kürzlich ist den Forschenden ein erster Trainingsrun gelungen, bei dem ein solch generatives Modell aus künstlich erzeugten Röntgenbildern über mehrere Standorte hinweg trainiert werden konnte.
Offen und übertragbar
Die entwickelte Technologie soll öffentlich verfügbar gemacht werden. Das Team von SWAG will eine internationale Data-Science-Challenge organisieren, um das Potenzial der Open-Source-Community für die KI-Entwicklung zu nutzen. Auf diese Weise sollen auch andere Krebsforscherinnen und Krebsforscher Zugang zu den Daten bekommen.
Das Besondere an diesem Ansatz ist, dass nicht nur die synthetischen Datensätze, sondern auch die trainierten Modelle mit der Wissenschaftsgemeinschaft geteilt und gemeinsam weiterentwickelt werden können. Das ist auch für die Therapie weiterer Krebserkrankungen von Bedeutung. „Das Nierenzellkarzinom ist ein Prototyp für viele andere onkologische Erkrankungen, bei denen große Datensätze schwer zu generieren sind und die Kombination verschiedener bildgebender Verfahren für die klinische Behandlung und Entscheidungsfindung äußerst wichtig ist“, sagt Bettina Baeßler. So können die Ergebnisse von SWAG dabei helfen, Nierentumoren und andere seltene Krebserkrankungen besser zu bewerten und zu behandeln.