LLMs in der Kodierung: Der Mensch bleibt Spitzenreiter, die KI holt auf
Eine Studie zur OPS-Kodierung bei Meningeomoperationen vergleicht GPT-Modelle mit Chirurg:innen und Kodierfachkräften. Ergebnis: Kodierer erzielen bei ausreichender und optimaler Kodierung die besten Ergebnisse. GPT-4o und GPT CodeMedic bleiben zurück, wobei CodeMedic deutlich weniger Fehler macht und Chirurg:innen bei optimaler Kodierung übertrifft. Halluzinationen treten bei GPT-4o häufiger auf. Fazit: LLMs sind leistungsfähig, erreichen aber noch nicht die Präzision professioneller Kodierer:innen.
- IT
- Ökonomie
Die Kodierung operativer Leistungen bestimmt maßgeblich die Erlöse in der stationären Versorgung. OPS-Codes sind daher ein kritischer Faktor für die DRG-Gruppierung. Eine aktuelle Untersuchung prüfte, ob Large Language Models (LLMs) in der Lage sind, OPS-Codes aus Operationsberichten korrekt abzuleiten. In die Analyse gingen Daten von 100 Patient:innen ein, die 2023 und 2024 an Meningeomen operiert wurden. Erfasst wurden die Codes der Chirurg:innen, die Abschlusskodierung des Krankenhauses sowie die Ergebnisse zweier LLMs: GPT-4o und GPT CodeMedic.
Die Ergebnisse zeigen deutliche Unterschiede: Bei der ausreichenden Kodierung, die eine korrekte Basiskodierung erfordert, erreichten Kodierfachkräfte 100 %, Chirurg:innen 99 %. GPT-4o kam auf 78 %, GPT CodeMedic auf 89 % (p < 0,01). In der optimalen Kodierung, bei der zusätzliche erlösrelevante Codes berücksichtigt werden, blieben die Kodierfachkräfte mit 94 % führend. GPT CodeMedic erreichte 83 %, lag damit signifikant vor den Chirurg:innen (69 %, p = 0,03) und hinter den Kodierfachkräften. GPT-4o blieb mit 74 % zurück. Auffällig war die niedrigere Halluzinationsrate bei CodeMedic (7 %) im Vergleich zu GPT-4o (15 %).
LLMs können OPS-Codes aus Texten generieren, benötigen jedoch spezialisierte Anpassungen. Kodierfachkräfte sind weiterhin unangefochten an der Spitze. Dennoch zeigen spezialisierte Modelle eine Leistungsfähigkeit, die in bestimmten Aspekten bereits mit der ärztlichen Kodierung vergleichbar ist. Der Einsatz von KI könnte in Zukunft für administrative Entlastung sorgen, erfordert aber klare Qualitäts- und Sicherheitsmechanismen.
springer.com
Gebündelt, stets aktuell und immer handverlesen werden alle Neuigkeiten gesammelt und anwenderbezogen aufbereitet.