LMU-Studie: Nicht die KI-Diagnose zählt, sondern wie sie begründet wird
Schrittweise KI-Erklärungen steigern die diagnostische Genauigkeit von Radiologinnen und Radiologen um 12,2 Prozentpunkte gegenüber einer Kontrollgruppe ohne KI-Unterstützung…
- Data und KI
- Digitale Klinik
Ein Forschungsteam der LMU München, des LMU Klinikums, des Karlsruher Instituts für Technologie und der Universität Bayreuth zeigt in einem randomisierten Experiment: Die Form der KI-Erklärung entscheidet über den diagnostischen Nutzen, nicht allein die Qualität der KI-Diagnose. 101 Radiologinnen und Radiologen beurteilten reale klinische Fälle mit CT- und MRT-Aufnahmen unter vier Bedingungen: ohne KI, mit reiner Diagnoseausgabe, mit Differentialdiagnose oder mit schrittweiser „Chain-of-Thought“-Erklärung.
Die höchste diagnostische Genauigkeit erzielten Teilnehmende mit schrittweisen Erklärungen: 12,2 Prozentpunkte über der Kontrollgruppe. Einfache Diagnoseausgaben und Differentialdiagnosen schnitten schlechter ab. Bei fehlerhaften KI-Vorschlägen folgten Teilnehmende der Differentialdiagnose häufiger, was auf Automationsbias hindeutet.
Dr. Boj Friedrich Hoppe vom LMU Klinikum betont: Ärztinnen und Ärzte müssen nachvollziehen können, welche Hinweise für eine Diagnose sprechen und wo Unsicherheiten liegen. Schrittweise Begründungen machen die Argumentation des Modells sichtbar und erleichtern den Abgleich mit dem eigenen Fachwissen.
Stefan Feuerriegel, korrespondierender Autor und Professor an der LMU Munich School of Management, sieht die Ergebnisse über die Radiologie hinaus relevant: Wer KI-Systeme aktiv nach nachvollziehbaren Begründungen befragt, nutzt sie deutlich effektiver. KI-Systeme sollten als unterstützende Werkzeuge verstanden werden, nicht als Ersatz für ärztliche Expertise.
Gebündelt, stets aktuell und immer handverlesen werden alle Neuigkeiten gesammelt und anwenderbezogen aufbereitet.