Similarity Search for Richly Annotated Structured Patient Cases
Final Report Abstract
In diesem Projekt wurden Informationen aus einer Reihe verschiedener Datenmodalitäten, wie sie im Gesundheitswesen über Patienten in elektronischer Form erhoben werden, genutzt, um eine Vergleichbarkeit von Patienten vor dem Hintergrund aktueller medizinischer Fragestellungen herzustellen. Dies beinhaltet u.a. genetische Daten, onkologische Befunddaten intensivmedizinische Daten und Daten aus der niedergelassenen allgemeinmedizinischen Praxis. Dabei wurde jeweils auch insbesondere der zeitliche, prozedurale Behandlungsverlauf des Patienten bzw. der Patientin mit einbezogen. Einige der wichtigsten Beiträge des Projektes umfassen: • Die Entwicklung und Veröffentlichung einer Blaupause für die Speicherung und Nutzung von genetischen Mutationsdaten und der sie betreffenden Therapieoptionen am Beispiel von Krebspatienten, zusammen mit einem Katalog an Vorgehensempfehlungen zur Herstellung von Vergleichbarkeiten zwischen den so gespeicherten Daten. • Die Implementierung eines Verfahrens, um prozedurale Daten aus allgemeinmedizinischen Patientenakten in eine Repräsentation zu überführen, die in üblichen maschinellen Lernverfahren verwendet werden kann. Dieses Verfahren wurde verwendet, um die Vorhersagbarkeit von Demenzerkrankungen zu untersuchen. • Ein Beitrag zur Erstellung eines (bald) frei verfügbaren, anonymisierten deutschsprachigen Korpus an medizinischen Dokumentationstexten aus der Onkologie mit Annotationen zu Diagnosen, Behandlungen und Medikamenten. Dazu ein Leitfaden, wie solche Annotationen gerade unter Berücksichtigung der Besonderheiten deutscher Texte erstellt werden können. • Die Nutzung von prozeduralen Informationen aus der intensivmedizinischen Versorgung zur Sterblichkeitsvorhersage. Das Projekt konnte in durch die Nutzung von Kooperationen mit einer Reihe von benachbarten Projekten auf einem Spektrum an verschiedenen Daten forschen. Dass die datenschutzrechtliche Situation die institutionsübergreifende Entwicklung von digitalen Anwendungen auf der Basis großer Datenmengen (Big Data), die nicht automatisiert anonymisiert werden können, aber geradezu verunmöglicht, war eine überraschend große Herausforderung im Projekt. Als Konsequenz muss aktuell dazu geraten werden, innerhalb der forschenden Einrichtungen des Gesundheitssystems gerade auch wissenschaftliches Personal mit Informatikhintergrund zu beschäftigen (und auch dort durch entsprechende Projekte und Mittel zu fördern), welches aktuelle Algorithmen und Methoden der Informatik auf medizinischen Daten zur Anwendung bringen, erforschen und weiterentwickeln kann. Es ist zu hoffen, dass gemeinsame Forschung in Zukunft durch die sich weiterentwickelnde Gesetzeslage zur Nutzung von Patientendaten im Sinne aller – gerade auch der Patienten – auch in Deutschland erleichtert wird.
Publications
- (2017). Design of an Information Extraction Pipeline for German Clinical Texts. Workshop on Extraction and Processing of Rich Semantics from Medical Texts, 2017
Kittner, M., Bajwa, B., Rieke, D., Lamping, M., Starlinger, J. and Leser, U.
- (2018) Prognostic Performance Of The QSOFA Score For In-Hospital Mortality In ICU. PDA72 2018, New York, USA, December 2018
Poncette, A-S., Starlinger, J., Spies, C., Vorderwülbecke, G., Treskatsch, S., Balzer, F.
- (2018) Variant Information Systems for Precision Oncology. BMC medical informatics and decision making, 18(1), 107
Starlinger, J., Pallarz, S., Seva, J., Rieke, D., Sers, C., Keilholz, U. and Leser, U.
(See online at https://doi.org/10.1186/s12911-018-0665-z) - (2019). Comparative Analysis of Public Knowledge Bases for Precision Oncology JCO Precision Oncology 3 (2019): 1-8
Pallarz, S., Benary, M., Lamping, M., Rieke, D., Starlinger, J., Sers, C., Wiegandt, D. L., Seibert, M., Seva, J., Schäfer, R., Keilholz, U., and Leser, U.
(See online at https://doi.org/10.1200/PO.18.00371) - (2019). VIST – A Variant-Information Search Tool for Precision Oncology BMC Bioinformatics 20(1), 429
Seva, J., Wiegandt, D., Goetze, J., Lamping, M., Rieke, D. T., Schaefer, R., Jähnichen, P., Kittner, M., Pallarz, S., Starlinger, J., Keilholz, Ul., and Leser, U.
(See online at https://doi.org/10.1186/s12859-019-2958-3) - (2020). A Permutation Invariant Neural Network for Table Orientation Classification. Data Mining and Knowledge Discovery 34.6 (2020): 1963-1983
Habibi, M., Starlinger, J. and Leser, U.
(See online at https://doi.org/10.1007/s10618-020-00711-x) - (2020). Could dementia be detected from UK primary care patients’ records by simple automated methods earlier than by the treating physician? A retrospective case-control study. Wellcome Open Research, 5(120), 120
Ford, E., Starlinger, J., Rooney, P., Oliver, S., Banerjee, S., van Marwijk, H., & Cassell, J.
(See online at https://dx.doi.org/10.12688%2Fwellcomeopenres.15903.1)