IA contre les médecins : les chatbots savent-ils vraiment poser des diagnostics fiables ?

Psychologue, cuisinier, traducteur, parfois même partenaire: l’intelligence artificielle peut endosser (plus ou moins bien) de multiples rôles, se substituant à des professionnels en chair et en os — avec tous les risques que cela comporte. Mais qu’en est-il en tant que médecin ? Pouvons-nous faire confiance aux diagnostics formulés par des chatbots comme ChatGPT ou Gemini, ou vaut-il mieux encore se tourner vers des médecins dotés d’une intelligence humaine ?

La réponse est, en quelque sorte, rassurante: selon ce que révèle une étude publiée dans JAMA Network Open, il est vrai que l’IA se débrouille plutôt bien pour formuler des diagnostics lorsqu’elle dispose de toutes les informations nécessaires, mais elle n’est pas du tout fiable durant la phase initiale, lorsque, avec peu de données à disposition, il faut déterminer de quelle maladie souffre le patient et quels examens prescrire pour approfondir l’investigation.

Les limites de l’intelligence artificielle

Les chercheurs ont demandé à 21 modèles linguistiques de grande taille (LLM), dont ChatGPT, DeepSeek, Claude, Gemini et Grok, de se faire passer pour des médecins dans 29 scénarios cliniques.

Les résultats mettent en lumière toutes les limites de l’IA, incapable de raisonnement déductif et efficace uniquement si elle est guidée par les données correctes: d’une part, les chatbots se révélaient des médecins valides dans plus de 90 % des cas lorsque toutes les informations utiles leur étaient fournies simultanément, d’autre part ils peinaient considérablement dans les phases préliminaires du processus diagnostique, celles où il faut dresser une liste de diagnostics différentiels à vérifier. Les LLM analysés n’ont pas été en mesure d’arriver à des diagnostics différentiels corrects dans plus de 80 % des cas.

Uniquement des assistants

«Malgré les améliorations constantes, les modèles linguistiques de grande taille ne sont pas encore prêts pour un emploi clinique autonome et sans supervision», commente Marc Succi, l’un des auteurs.

«Les diagnostics différentiels sont centraux dans le raisonnement clinique et constituent le socle de cet art de la médecine que l’intelligence artificielle n’est pas encore capable de reproduire». Chers médecins, vous pouvez être rassurés: l’IA aura une écriture plus lisible que la vôtre, mais elle n’est pas encore en mesure de vous remplacer.