TextMining von Meldungstexten für einheitliche Klassifikationen (TeMeK)

In diesem Projekt werden KI-Methoden zum automatisierten Extrahieren und Validieren strukturierter Informationen aus komplexen Freitexten, insbesondere aus Pathologiemeldungen für klinische Krebsregister, untersucht.

Förderung:

Bundesministerium für Gesundheit

Laufzeit:

  • 01.09.2022 – 31.08.2025

 

Projektpartner:

Projektbeschreibung

Die Daten der klinischen Krebsregister werden mit dem Ziel erhoben, die Versorgung von Krebspatientinnen und -patienten zu verbessern. Dies erfordert eine exzellente Datenqualität und Aktualität. Die in den Meldungen an die Krebsregister enthaltenen komplexen Freitexte – insbesondere Pathologie- und molekularpathologische Befunde – müssen extrahiert werden, was derzeit mit erheblichem manuellem Aufwand verbunden ist. Um diesen Prozess zu optimieren, werden im TeMeK-Projekt Methoden der künstlichen Intelligenz untersucht, angepasst und weiterentwickelt, um eine einheitliche, valide und effiziente Informationsextraktion zu ermöglichen.

Erwartete Ergebnisse

KI gestützte, einheitliche Extraktion relevanter Information aus Pathologie-Befunden.

Projektleitung:

Klinische Landesregisterstelle Baden-Württemberg GmbH
Geschäftsführer: Prof. Dr. med. Marco Halber
Birkenwaldstraße 149, 70191 Stuttgart

Aktualisierungen und Fortschritte:

  • Erste Ergebnisse zur Verbesserung der Erkennung von Pathomeldungen liegen vor.
  • Erweiterung des Datenbestandes zur Extraktion weiterer Features

Projektmeilensteine:

MeilensteinBeschreibungZeitpunkt
M0.1Kick-Offt0
M0.2Jahres Review It0+12
M0.3Jahres Review IIt0+24
M0.4Abschluss Reviewt0+36
M1.1Datenschutz-Begutachtung überall komplettt0+6
M1.2Test-Datenpool bereitt0+14
M1.3Quantitative Erweiterungt0+28
M1.4Qualitativer Abgleich erfolgtt0+28
M2.1Klassifikation Standardentitäten erfolgtt0+6
M2.2Konflikterkennung erfolgtt0+18
M2.3Zusatzmodule klassifiziertt0+30
M3.1Zeichenbasierte Klassifikatoren erstelltt0+8
M3.2Kontextbasierte Klassifikatoren erstelltt0+16
M3.3Klassifikatoren für häufige Entitäten erstelltt0+26
M3.4Verfahren für Varianten untersuchtt0+34
M3.5Kombinationsmöglichkeit mit AF2 untersuchtt0+34
M4.1M1.1t0
M4.2M1.2t0+12
M4.3M1.3t0+24
M4.4M1.4t0+36