Google erweitert Medizin-KI mit MedGemma 1.5 und MedASR
Google stellt neue medizinische KI-Modelle vor. MedGemma 1.5 und MedASR kombinieren Bild-, Text- und Sprachverarbeitung und eröffnen neue Einsatzfelder in Kliniken…
- Data und KI
- Medizin
Die Forschungsabteilung Google Research hat mit MedGemma 1.5 eine weiterentwickelte Version ihres multimodalen KI-Modells veröffentlicht. Das Open-Source-Modell baut auf medizinischen Text- und Bilddaten auf und erweitert die bisherigen Funktionen deutlich. Neben zweidimensionalen Aufnahmen verarbeitet MedGemma 1.5 nun auch dreidimensionale Bilddaten sowie zeitliche Verlaufsinformationen.
Das Modell unterstützt unter anderem die Befundung von CT- und MRT-Untersuchungen, den Vergleich serieller Röntgenaufnahmen und die Analyse von Gewebe- und Netzhautbildern. Interne Tests zeigen Leistungsgewinne bei Bildklassifikation, allgemeiner Befundung und der strukturierten Auswertung von Laborberichten. Trotz der erweiterten Fähigkeiten bleibt das Modell mit vier Milliarden Parametern vergleichsweise kompakt. Ein lokaler Betrieb in Krankenhäusern ist damit möglich.
Ergänzend hat Google das Sprachmodell MedASR vorgestellt. Es ist für medizinische Diktate und Fallbesprechungen ausgelegt und lässt sich mit MedGemma kombinieren. Beide Modelle werden über Plattformen wie Hugging Face bereitgestellt und sollen durch gezieltes Finetuning weiterentwickelt werden. Google fördert den Einsatz zusätzlich mit Schulungsmaterialien und einer internationalen Entwickler-Challenge.
Gebündelt, stets aktuell und immer handverlesen werden alle Neuigkeiten gesammelt und anwenderbezogen aufbereitet.