Intelligence artificielle et diagnostic médical : entre promesses et limites

L’intelligence artificielle (IA) continue de faire des avancées spectaculaires dans le domaine de la médecine. Parmi les technologies les plus discutées figurent les grands modèles de langage (LLM), comme ChatGPT, capables de générer des réponses textuelles à des problématiques complexes. Mais dans quelle mesure ces outils surpassent-ils les médecins humains ou complètent-ils leur expertise ? Deux études récentes, publiées dans des revues scientifiques de premier plan, apportent des éclairages contrastés sur cette question cruciale.

Une supériorité technique des LLM par rapport à certains groupes de médecins

Une étude publiée dans JAMA Network Open a évalué les performances des LLM dans le raisonnement clinique, en comparant leur efficacité à celle des médecins utilisant des ressources conventionnelles. Les résultats sont intrigants : bien que l’intégration d’un LLM comme aide au diagnostic n’ait pas significativement amélioré les performances cliniques des médecins, les LLM seuls ont surpassé à la fois les médecins utilisant les ressources conventionnelles et ceux ayant accès à l’outil.

Ces résultats soulèvent une question essentielle : pourquoi les LLM, lorsqu’ils sont utilisés comme compléments, n’améliorent-ils pas la pratique clinique ? Plusieurs hypothèses sont avancées :

  • Les médecins pourraient éprouver des difficultés à intégrer efficacement les suggestions des LLM dans leur processus de décision.
  • Une défiance envers l’IA ou une surcharge cognitive pourrait limiter leur adoption des recommandations proposées.

Dans un article consacré aux résultats de cette étude, le New York Times a présenté ces résultats comme une éventuelle remise en question de la supériorité humaine dans certains aspects du diagnostic médical, avec le titre évocateur : « A.I. Chatbots Defeated Doctors at Diagnosing Illness », « les chatbots d’intelligence artificielle ont surpassé les médecins dans le diagnostic des maladies. ». Cette approche journalistique souligne les attentes croissantes envers l’IA dans un domaine où l’expertise humaine était historiquement sans rival.

Les limites de l’IA dans les cas complexes

Cependant, une étude publiée dans le BMJ Open met en évidence des failles importantes des LLM dans des contextes plus exigeants. Les chercheurs ont comparé les performances de GPT-4 avec celles de médecins humains dans des cas complexes de soins primaires. Les résultats indiquent que les médecins humains étaient nettement plus performants, en particulier pour évaluer les antécédents médicaux, interpréter des informations non structurées, et naviguer dans des incertitudes diagnostiques.

Cette étude souligne que si l’IA excelle dans l’analyse de données structurées et l’identification de modèles, elle manque encore de la capacité à gérer des cas où les données sont imprécises, contradictoires ou fragmentées. De plus, l’empathie et la compréhension des dynamiques psychosociales restent des dimensions exclusivement humaines qui influencent fortement la qualité des soins.

Vers une collaboration homme-machine optimisée

Ces études illustrent à la fois le potentiel et les limites actuelles des LLM dans la pratique clinique. Plutôt que de chercher à opposer IA et médecins, une approche collaborative semble être la voie la plus prometteuse. Pour cela, plusieurs pistes peuvent être explorées :

  • Formation : intégrer des modules de formation sur l’utilisation des IA dans les cursus médicaux, pour améliorer l’intégration des recommandations fournies par ces outils.
  • Amélioration des modèles : développer des LLM capables de mieux contextualiser leurs réponses en tenant compte des incertitudes inhérentes aux cas cliniques complexes.
  • Réglementation et éthique : assurer une utilisation transparente et éthique des IA, en préservant toujours le rôle décisionnel du médecin.

Dans ce contexte, l’IA ne doit pas être perçue comme un substitut, mais comme un catalyseur capable d’améliorer la qualité des soins lorsque ses forces et faiblesses sont correctement évaluées. Les médecins et les chercheurs devront continuer à travailler de concert pour développer des modèles de collaboration optimaux, garantissant que la technologie reste un outil au service de l’humanité et non un rival.

Il est impératif que soient proposés aux professionnels de la santé, aux médecins en particulier, des formations sur les outils d’intelligence artificielle, et ceci dès que possible.

Jean Gabriel Jeannot, le 01.01.2025

PS: vous souhaitez-mieux comprendre, et mieux utiliser, des outils comme ChatGPT ? Lisez sur notre site l’article IA – La formation.

Image. La relation thérapeutique sera-t-elle bientôt formée par un trio, patient, médecin et IA ?