Navigation und Service

Datenschätze gemeinsam heben

Die aktuelle BMBF-Förderrichtlinie im Rahmen der Dekade gegen Krebs unterstützt neue Ansätze der Datenanalyse, um Forschungsrelevantes besser aus existenten Daten zu filtern und zu nutzen. Auch die Kultur des Datenteilens soll damit beflügelt werden.

Die moderne Krebsbehandlung gründet genau wie die Krebsforschung auf Daten. Neue Krebstherapien zielen auf die individuellen Eigenschaften von Tumoren ab, die durch eine gezielte Analyse des Tumorgewebes aufgedeckt werden können. Die dabei anfallenden so genannten „Omics“-Daten sind sehr umfangreich und komplex (mehr zum Thema).

Dazu kommen z.B. digitale Aufnahmen aus modernen Bildgebungsverfahren, die aufgrund der benötigten Qualität ebenfalls ein hohes Datenvolumen haben. Ärztinnen und Ärzte erfassen über Jahre hinweg Verlaufsdaten ihrer Patientinnen und Patienten, die u. a. an die klinischen Krebsregister übermittelt werden. Die Krebsforschung generiert ebenfalls große Datensammlungen, insbesondere in Studien.

Strukturierte Illustration der Genomanalyse
Um Krebs aufzudecken und optimal zu behandeln, sind viele Daten notwendig - beispielsweise über die histologischen, genetischen oder molekularen Unterschiede von Tumor- und gesunden Körperzellen. Auch das Wissen um die genaue Lokalisation von Krebs im Körper einer bzw. eines Erkrankten ist wichtig für eine erfolgreiche Therapie. © Adobe Stock / bloomicon

Vernetzung schafft mehr Wissen

Die Vernetzung der Daten aus Forschung und Versorgung ermöglicht eine schnelle Bereitstellung neuer Erkenntnisse am Krankenbett (Translation). Die Vernetzung beider Bereiche voranzubringen, ist das erklärte Ziel der AG "Wissen generieren durch Vernetzung von Forschung und Versorgung" der Nationalen Dekade gegen Krebs.

Big Data: Analyse braucht hohe Datenqualität, Expertise und Strukturen

Aufbau von Vernetzungsstrukturen

Mit der Förderung von Digitalen FortschrittsHubs in der Medizininformatik-Initiative adressiert das BMBF den Aufbau erforderlicher Strukturen für eine bessere Vernetzung.

Die Extraktion forschungsrelevanter Informationen aus umfangreichen Datensätzen – man spricht von Big Data – ist wegen des Volumens und der Komplexität nicht mehr durch das menschliche Gehirn leistbar. Hier sind Computer mit entsprechenden Kapazitäten und Programmen gefragt. Ein wichtiges Instrument bei der Auswertung ist die künstliche Intelligenz (KI), also die Analyse von Daten beispielsweise mithilfe lernender Systeme.

Grundlage sind Algorithmen, die in den großen Datenmengen Zusammenhänge erkennen können. Bioinformatikerinnen und Bioinformatiker, die diese entwickeln und bedienen, sind speziell für diese Aufgabe ausgebildet. Zur Auswertung müssen je nach Forschungsfeld zudem verschiedene weitere Expertinnen und Experten beitragen.

Wozu all die Daten?

In diesen Daten können Wissenschaftlerinnen und Wissenschaftler nach Zusammenhängen und Auffälligkeiten forschen.

So lassen sich beispielsweise aus den Tumor-Analysen vieler Patientinnen und Patienten immer detailliertere Erkenntnisse u. a. über die Auswirkungen von Erbgutveränderungen auf die Krebsentwicklung gewinnen.

Verknüpft mit den klinischen Verlaufsdaten können Forschende evaluieren, welche Art der Behandlung bei z.B. welcher DNA-Mutation am besten anschlägt.

Aus den Erkenntnissen lassen sich Rückschlüsse für die Arzneimittelforschung und -entwicklung sowie neuer Therapieoptionen ziehen. Sich daraus ergebende neue Fragen geben Anstöße für weitere Grundlagenforschung.

Status quo

Trotz bemerkenswerter Fortschritte in den Bereichen der KI, der Bioinformatik und der statistischen Methoden erfolgt die Auswertung und die Nutzung der bereits heute anfallenden digitalen Datenmengen bislang in einem noch viel zu geringen Umfang. Es ist zu erwarten, dass die erzeugten Daten mit der Weiterentwicklung von neuen Diagnosemethoden und des personalisierten Vorgehens in der Onkologie noch komplexer und umfangreicher werden. Der Datenauswertung wird eine immer wichtigere Rolle zukommen. Sie eröffnet große Chancen für die Zukunft der Krebsmedizin.

Impuls zur Ausschöpfung der Potentiale im Rahmen der Nationale Dekade gegen Krebs

Das Bundesministerium für Bildung und Forschung (BMBF) schreibt im Rahmen der Nationalen Dekade gegen Krebs eine Richtlinie zur Förderung von interdisziplinären Projekten zur Entwicklung und Erprobung von neuen Ansätzen der Datenanalyse und des Datenteilens in der Krebsforschung aus. Ziel ist es, Wissenschaftlerinnen und Wissenschaftlern aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu den hochqualitativen Daten aus der translationalen, biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Wissenschaftlerinnen und Wissenschaftler aus den Bereichen der Datengewinnung und Datenanalyse sollen eng zusammenarbeiten und miteinander eine klinisch relevante onkologische Frage beantworten.

Warum ist eine Kultur des Datenteilens wichtig?

In der Praxis kommen bislang Datenanalysierende oftmals noch zu selten mit Forschenden aus den Disziplinen zusammen, die in ihrer Arbeit Daten erheben. Das führt zum einen dazu, dass erstere nach Daten suchen müssen, um ihre Modelle zu testen, und nicht wissen, wie sie Zugang dazu bekommen. Auf der anderen Seite drohen beispielsweise in Studien erhobene Datensätze nach Erstpublikation brachzuliegen, könnten jedoch noch zu einem deutlichen Erkenntnisgewinn beitragen, wenn sie mittels neuer Methodik oder neuer Fragestellung re-analysiert würden. Daher ist ein weiteres wichtiges Ziel der Förderung, Forschende des einen Forschungsbereichs mit denen des anderen zusammen zu bringen und die Kultur des Datenteilens für Forschungszwecke zu fördern.

Förderziel und Zuwendungszweck

Die geförderten Vorhaben sollen ein herausforderndes Problem der Datenanalyse im Zusammenhang mit einer klinisch relevanten onkologischen Fragestellung adressieren. Um das volle Potential der Daten auszuschöpfen, sollen Expertinnen und Experten für die Inhalte und die Kontexte, aus denen die Daten gewonnen wurden eng mit Datenanalytikerinnen und -analytikern zusammenarbeiten.

  • Infrage kommen Vorhaben, die Ansätze der Datenanalyse in der Onkologie mithilfe von statistischen, bioinformatischen Methoden sowie der künstlichen Intelligenz entwickeln und erproben.
  • Förderbar sind zudem Vorhaben, die auf Basis von realen onkologischen Daten qualitätsgesicherte Trainings-, Validierungs- und Testdatensätze entwickeln, die der wissenschaftlichen Gemeinschaft zur Erprobung von Datenanalysemethoden dienen sollen.

Die Vorhaben sollen mindestens einem der folgenden drei Module zugeordnet werden:

Modul 1: Data-Challenge Projekte und Workshops

Hier werden Projekte gefördert, die die Durchführung mehrtägiger Workshops in fokussierter und intensiver Arbeitsatmosphäre einschließlich mehrmonatiger Vor- und Nachbereitung umfassen. Dabei soll eine Gruppe von Wissenschaftlerinnen und Wissenschaftlern eine Forschungsfrage vorab selbst definieren und mit vorhandenen und kompatibel gemachten Daten in einem Workshop analysieren. Mögliche Formate sind Datenanalyse-Wettbewerbe (Data-Challenges), bei denen eine vorgegebene klinisch relevante Datenanalyseaufgabe mittels statistischer, bioinformatischer oder KI-Methoden von konkurrierenden Teams bearbeitet und den Teams notwendige Datensätze für eine begrenzte Zeit zur Verfügung gestellt werden.

Modul 2: Projekte des föderierten Lernens

Ein oder mehrere dieser Aspekte sollen in Modul 1 und 2 adressiert werden:

● Entwicklung neuer Software oder Anpassung von vorhandener Software auf die mögliche Anwendung für die gegebene Fragestellung;
● Entwicklung von KI-Lösungen, um heterogene oder dezentrale Daten verknüpfen und bearbeiten zu können;
● Entwicklung oder Anpassung von Algorithmen für spezifische Fragestellungen, z. B. um Behandlungskonzepte oder das Design von klinischen Studien zu optimieren; auch unter Berücksichtigung von weiteren Faktoren wie der PatientReportedOutcomes (PRO).

Modul 3: Erstellung von qualitätsgesicherten Trainings-, Validierungs- und Testdatensätzen

Um die Entwicklung und Optimierung von Methoden und Algorithmen der Datenanalyse – insbesondere von KI-Methoden – voranzubringen, ist die Etablierung von qualitätsgesicherten Trainings-, Validierungs- und Testdatensätzen erforderlich. Werden diese geeignet aufbereitet und annotiert der wissenschaftlichen Gemeinschaft dauerhaft zur Verfügung gestellt. So können Datenanalysemethoden verglichen und verbesserte Methoden entwickelt werden. In Projekten des Moduls 3 sollen daher qualitätsgesicherte, annotierte und datenschutzkonforme Trainings-, Validierungs- und Testdatensätze erstellt werden, die auf realen medizinischen Daten basieren. Eine klinische Relevanz der Datenanalyseaufgabe sowie eine enge Zusammenarbeit von Datengenerierenden mit Datenanalysierenden bei der Erstellung der Datensätze ist hier ebenso wichtig wie für die Module 1 und 2. Die im Rahmen des Projekts erstellten Datensätze sollen dann der wissenschaftlichen Gemeinschaft dauerhaft zur Verfügung gestellt werden, um damit zukünftige datengetriebene Forschung und KI-Entwicklungen zu ermöglichen.

In allen Projekten sollen existierende Datensätze für die Analyse von Forschungsfragestellungen genutzt werden. Nicht förderfähig sind Projekte, deren Fokus auf der Generierung neuer Daten liegt; ebenso wenig Projekte die keine Datenanalyseaufgabe mit konkretem Bezug zu einer klinisch relevanten onkologischen Fragestellung adressieren oder klinische Studien.

Patienteneinbindung

Ein Schwerpunkt in allen Vorhaben und Maßnahmen der Nationalen Dekade gegen Krebs ist die starke und gleichberechtigte Einbindung von Betroffenen. Das BMBF geht hier mit gutem Beispiel voran: Jede Förderung ist an die nachweisliche Einbindung von Patientinnen und Patienten gebunden, sowohl bei der Entwicklung der Ausschreibungen als auch in den geförderten Projekten selbst. Menschen, die wissen, wie es ist mit Krebs zu leben, sollen die Möglichkeit haben, sich am Forschungsprozess zu beteiligen. Durch ihre Sichtweise können sie Forschenden helfen, die entscheidenden Inhalte zum Wohle und Nutzen Betroffener zu extrahieren.

Zu den Europäischen Prinzipien zur Einbindung von Krebspatientinnen und -patienten

Anträge auf Förderung sowie eine Vorhabenbeschreibung in schriftlicher und elektronischer Form sind bis 18. Dezember 2023 vorzulegen. Detaillierte Vorgaben sind der Richtlinie zu entnehmen.

Partner und Unterstützer