Covid-19, l'intelligence artificielle touche ses limites

Les hôpitaux expérimentent de plus en plus de systèmes d'intelligence artificielle pour aider les médecins à diagnostiquer et évaluer le Covid-19. Jusqu'à présent, les résultats sont mitigés. Pas assez de recul pour l'IA, et une confiance limitée de la part des médecins.

Plusieurs hôpitaux dans le monde ont commencé à utiliser un logiciel d'intelligence artificielle (IA) pour analyser les images radiologiques. Premier intérêt : détecter rapidement un Covid-19, lorsqu’un scanner ou une radiographie peuvent prendre des heures et que les tests des prélèvements nécessitent plusieurs jours. Mais l’IA est aussi sollicitée pour évaluer la gravité de la maladie ou encore son évolution, par exemple en combinaison avec d'autres paramètres tels que la saturométrie.

Si l’IA s'est révélée prometteuse ces dernières années dans l'évaluation des tumeurs et autres pathologies pulmonaires, certains médecins estiment qu’elle n’est pas fiable concernant le Covid-19. D'autres médecins considèrent qu’elle peut fournir des informations complémentaires. Il est bien trop tôt pour évaluer l’efficacité réelle de l’IA, mais si elle s'avère souvent efficace lors des essais, ses résultats peuvent être décevants en situation réelle, forcément plus imprévisible et complexe.

Pas assez de recul

«Je ne pense pas que notre flux de travail se soit amélioré de manière significative.» déclarait ainsi le professeur Francesco De Cobelli, chef de l'unité de radiologie de l'hôpital San Raffaele à Milan. Cet hôpital universitaire a testé les logiciels basés sur l’IA de trois fournisseurs différents, destinés à évaluer les radiographies et les scanners. Les médecins de son service ont immédiatement décelé des erreurs dans le système fourni par qure.ai, une startup indienne, qui a notamment surévalué la gravité de certains cas.
«Le problème, c’est que ce logiciel n'a pas été conçu pour le Covid-19, mais pour la tuberculose.» a déclaré le professeur De Cobelli. Il semblerait que ce problème a depuis été résolu grâce aux remontées quotidiennes d’informations effectuées par les médecins.

Certaines entreprises affirment que leurs systèmes de balayage pulmonaire sont capables de détecter le Covid-19 avec un taux de précision de 96% ou plus. Les médecins sont sceptiques quant à la possibilité d'atteindre ces chiffres dans le monde réel. En effet, les entreprises doivent construisent leurs algorithmes en les entrainant sur des milliers de scanners pulmonaires. Elles ont donc probablement eu recours à ceux de patients qui n’étaient pas affectés par le Covid-19, mais par d'autres pathologies. «Il a fallu cinq ans pour valider les systèmes d'IA qui peuvent détecter le cancer du sein.» rappelait le Dr Hugh Harvey, un radiologue britannique. «Il est impossible que quelqu'un ait pu faire ce travail pour le Covid-19 au cours des trois derniers mois.»

Des logiques différentes

À Moscou, des dizaines d'hôpitaux envoient des scanners au département de la ville en charge de la santé. Ils sont évalués avec un logiciel d'IA dans le cadre d'essais cliniques. Si les résultats sont satisfaisants, le logiciel sera mis à la disposition des médecins de l’hôpital. Ceux-ci sont inquiets, car «Ils ne connaissent tout simplement pas les forces et les faiblesses des algorithmes, et se méfient des décisions concernant un patient basées sur un rapport informatique.» explique le Dr Ivan Blokhin, impliqué dans cet essai qui utilise le logiciel RADLogics.

Pour ce chercheur, l'un des défis de cette nouvelle approche est d'habituer les médecins à de nouvelles mesures qui n'ont pas encore été validées. «Les radiologues recherchent généralement les signes visuels du virus, par exemple les opacifications en verre dépoli.» Mais l'AI ne peut pas fonctionner de la même manière, donc elle recherche d'autres paramètres. Par exemple, les algorithmes de RADLogics évaluent combien de centimètres cubes des poumons d'un patient ont été affectés par le Covid-19. «Nous ne disposons pas de suffisamment d'informations pour montrer qu'il s'agit d'un paramètre utile. Et actuellement les évaluations de l'IA et des médecins ne correspondent pas toujours.» admet le Dr Blokhin.

RADLogics coronavirus detection at work

Peut mieux faire

Depuis la mi-mars, le Campus polyclinique universitaire Bio-Medico de Rome utilise le logiciel de Beijing Infervision Technology, une start-up chinoise, pour évaluer chaque semaine une centaine de patients atteints du Covid-19. Le professeur Beomonte Zobel, directeur du centre d'imagerie de l'hôpital, a constaté que ce logiciel a parfois confondu Covid-19 avec d'autres formes de pneumonie virale. Cependant, il reconnait son efficacité pour évaluer la gravité de la maladie et affirme que cela vaut la peine de l’utiliser car «Vous faites beaucoup plus de tests en moins de temps.» La start-up pour sa part est confiante dans le fait que son IA fera de moins en moins d’erreurs pour le diagnostic différentiel au fil du temps.

^{Références :

L’intelligenza artificiale al lavoro contro la COVID-19 (esanum.it)

Olson P. Technology: answers elude AI in fight against virus. The Wall Street Journal. 5 May 2020}