In der Studie wurden drei große Sprachmodelle (ChatGPT, DeepSeek, Le Chat Mistral) mit international renommierten Thromboseexpert:innen verglichen. Ärzt:innen aus 18 Ländern beurteilten in einer verblindeten Bewertung sowohl Antworten zu häufigen Fragen in der Patient:innenaufklärung als auch Handlungsempfehlungen zu drei komplexen klinischen Fallbeispielen.
Im Bereich der Patient:innenaufklärung konnte die KI mit klaren, verständlichen und strukturierten Antworten überzeugen und wurde von den unabhängigen Gutachter:innen etwas besser bewertet als die Antworten der Expert:innen. Bei den klinischen Fallbeispielen, wie der Behandlung einer tiefen Beinvenenthrombose bei einer jungen Frau, lieferten die Sprachmodelle vergleichbare Ergebnisse zu jenen der Ärzt:innen.
Die Autor:innen weisen darauf hin, dass KI-Sprachmodelle das ärztliche Handeln sinnvoll ergänzen können, aber Ärzt:innen nicht ersetzen können. Außerdem bleiben Datenschutz, Aktualität der Evidenz und die Verantwortung in der Entscheidungsfindung zentrale Herausforderungen.