MENÜ

Jahresberichte

Entwicklung, Implementierung und Dokumentation von Data Processing Workflows

GMDS Jahresbericht 2025

Projektgruppe
Entwicklung, Implementierung und Dokumentation von Data Processing Workflows

Markus Wolfien, Dresden (Leiter) 

Tätigkeit vom 1. Januar 2025 bis 31. Dezember 2025

Die Projektgruppe „Data Processing Workflows“ beschäftigte sich auch im Jahr 2025 mit der Entwicklung, Dokumentation und Anwendung reproduzierbarer Datenverarbeitungs- und Analyseworkflows in der medizinischen Informatik, Bioinformatik und translationalen Forschung. Die Gruppe umfasst aktuell 12 aktive Mitglieder.

Im Berichtszeitraum wurde die Sichtbarkeit der Arbeiten zu datengetriebenen Workflows durch einen eingeladenen Vortrag weiter erhöht. Im Rahmen der Virtual Keynote der EIT Health Morning Health Talks (Prag) mit dem Titel „Leveraging Synthetic Patient Data to Empower Clinical AI in Oncology“ wurden insbesondere workflowbasierte Ansätze zur Erzeugung, Optimierung und Nutzung synthetischer Patientendaten für klinische KI-Anwendungen in der Onkologie vorgestellt.

Darüber hinaus wurde ein Buchkapitel mit dem Titel „A Current Perspective of Medical Informatics Developments for a Clinical Translation of (Non-coding)RNAs and Single-Cell Technologies“ in der Reihe Methods in Molecular Biology veröffentlicht. Das Kapitel adressiert unter anderem die Rolle der Medizinischen Informatik bei Standardisierung, Datenintegration und Analyse komplexer Einzelzell- und ncRNA-Daten im Kontext personalisierter Medizin.

Auf Grundlage der Diskussionen im Umfeld der GMDS 2024 wurde zudem die Arbeit „TCGADownloadHelper: simplifying TCGA data extraction and preprocessing“ umgesetzt und 2025 in Frontiers in Genetics publiziert. Die Arbeit beschreibt einen Python- und Snakemake-basierten Workflow zur vereinfachten Extraktion, Umbenennung und Vorverarbeitung von TCGA-Daten und adressiert damit konkrete Herausforderungen reproduzierbarer, skalierbarer Datenverarbeitung.

Ein informelles Treffen der Projektgruppe fand im Rahmen der GMDS-Jahrestagung 2025 in Jena statt. Dabei wurden laufende Aktivitäten, mögliche gemeinsame Publikations- und Workshopformate sowie zukünftige Themenschwerpunkte der Projektgruppe diskutiert.

Vorgesehene Aktivitäten in 2026

Für 2026 ist die Weiterentwicklung eines Workflows zur Erzeugung synthetischer Daten in Kombination mit Hyperparameteroptimierung geplant. Ziel ist es, reproduzierbare und besser standardisierte Analyseprozesse für die Generierung und Bewertung synthetischer klinischer Daten zu unterstützen und diese perspektivisch für medizinische KI-Anwendungen nutzbar zu machen.

Amtszeit der Leiter*innen (o.ä.) und deren Vertretung

Oktober 2024 bis September 2027

Tätigkeitsbericht

Zu dieser Arbeitsgruppe liegt kein Tätigkeitsbericht vor.