publicité
Facebook Facebook Facebook Partager

Gynécologie & Sénologie

Publié le 01 sep 2023Lecture 16 min

Intelligence artificielle et dépistage par mammographie du cancer du sein : entre faits et promesses…

Patrice TAOUREL, Département d’imagerie médicale Lapeyronie, CHU de Montpellier

Le 27 octobre 2016 à Toronto, au Canada, Geoffrey Hinton, une des stars de l’intelligence artificielle (IA) affirmait qu’il fallait cesser de former des radiologues car les algorithmes les auraient dépassés avant 5 ans. Plus de 7 ans après, force est de constater que l’IA a relativement peu changé la pratique clinique des radiologues.

L’année dernière, le Comité consultatif national d’éthique insistait sur la difficulté à distinguer faits et promesses, et en matière d’imagerie, que ce soient la radiologie, l’anatomopathologie, la dermatologie ou l’ophtalmologie, les promesses de l’IA sont nombreuses. Le dépistage du cancer du sein par mammographie représente un champ dans lequel l’IA prendra, à n’en pas douter, une place importante dans les années à venir. Plusieurs faits expliquent pourquoi la mammographie représente un secteur privilégié du développement de l’IA : – le cancer du sein constitue une pathologie fréquente avec un diagnostic reposant essentiellement sur l’imagerie ; – les acquisitions en mammographie sont standardisées (face, oblique) ; – le volume de données digitalisées accessibles est très important ; – les bases de données du dépistage constituent un outil robuste pour classer les patientes comme porteuses ou non d’un cancer du sein ; – le lexique BIRADS d’interprétation est largement utilisé et de façon plutôt reproductible ; – le dépistage et la mammographie s’intéressent à une seule maladie : le cancer ; – les systèmes de CAD (Computer-Aided-Detection) ont commencé à être développés il y a plus de 20 ans. Malgré cet enthousiasme et des projections très positives quant au rôle de l’IA, l’histoire du CAD aux États-Unis doit amener à beaucoup de prudence. En effet, le premier agrément de solution de CAD par la FDA date de 1998 avec, dès lors, un financement par des systèmes assuranciels. En 2015, 90 % des cabinets de radiologie étaient équipés de CAD aux États-Unis. Néanmoins, plusieurs études ont démontré que l’utilisation de ces CAD entraînaient une baisse de la spécificité avec une augmentation de 20 % du nombre de biopsie(1) ; mais également, et de façon beaucoup moins intuitive, que l’utilisation du CAD entraînait une baisse de la sensibilité de 6 % dans une étude publiée en 2015, dans le JAMA sur plus de 320 000 femmes(2). En 2015, cette première expérimentation à l’échelle des États-Unis s’est conclue avec la fin du remboursement du CAD. Les systèmes d’IA, aujourd’hui, sont très différents des CAD développés il y a plus de 30 ans, ils sont construits avec une quantité de données beaucoup plus importantes et à partir de technique de deep learning dont la compréhension profonde est au-delà de l’article proposé ici. Nous détaillerons au cours de cet article les différents niveaux dans lesquels l’IA pourrait être utile en mammographie : – IA en substitution du radiologue ? – IA en support du radiologue ? – IA pour éviter des interprétations du radiologue en simple ou en double lecture ? – IA pour diminuer le nombre de cancers de l’intervalle ? – IA pour la mesure de la densité mammaire ? – IA comme prédiction du risque à venir du cancer du sein ? – IA avec des performances équivalentes pour tous les logiciels développés sur le marché ? – IA dans la réalisation et le contrôle qualité de la mammographie ? Pour répondre à ces différentes questions, à côté d’une approche objective et synthétique de la littérature, nous ferons état de façon parfaitement subjective de notre expérience pratique puisque nous utilisons depuis presque 3 ans un logiciel d’IA, le logiciel Transpara, qui est le plus utilisé et donc le plus évalué dans les publications disponibles sur l’IA en mammographie.   L’intelligence artificielle à la place du radiologue (décrit dans la littérature anglo-saxonne comme IA stand alone) Le principe de cette option est de remplacer le radiologue par l’IA qui interpréterait toutes les mammographies. De nombreuses publications évaluent cette option depuis près de 5 ans avec des résultats disponibles principalement sur la mammographie 2D, beaucoup moins sur la tomosynthèse, et pas sur la reconstruction synthétique. Les résultats sont très variables, il y a eu une première période d’enthousiasme symbolisée par une étude publiée dans la très prestigieuse revue Nature(3). Cette étude promue par la firme Google concluait à une supériorité de l’IA par rapport aux radiologues. Mais comme l’a clairement noté le Pr Isabelle Thomassin dans une analyse publiée sur www gyneco-online.com (Le futur de l’imagerie, l’émergence de l’IA et son apport en mammographie, février 2020) : si le modèle de détection par IA dans l’article publié dans Nature était implémenté sur une cohorte de plus de 500 000 femmes, la comparaison IA/performance humaine a été conduite sur 500 femmes avec des chiffres de sensibilité dans la détection du cancer du sein pour certains radiologues très bas (autour de 50 %) et avec une incidence du cancer 3 fois supérieure à celle attendue du dépistage. Cette étude montre à mon sens un manque de rigueur méthodologique possible même dans certaines revues très prestigieuses mais également le poids important de l’industrie (ici Google) dans les publications scientifiques malgré la très forte sélectivité académique. Ces limites méthodologiques ont été récemment très bien analysées par une revue systématique portant sur 12 études qui évaluent 36 solutions d’IA. Cette revue mettait en lumière le faible niveau méthodologique de la plupart des études publiées avec des risques de biais méthodologiques, des doutes quant à l’applicabilité en routine clinique et concluait que 94 % des logiciels d’IA étaient moins performants qu’un radiologue(4). Le journal Le Monde titrait sa chronique : « L’œil de l’IA moins affûté que celui des médecins » alors que trois ans plus tôt, il avait titré « L’IA : as du diagnostic médical ». Une méta-analyse publiée en mai 2023(5) retrouve des résultats beaucoup plus positifs ; elle inclut finalement, 16 études avec plus d’un million d’examens de dépistage et près de 500 000 patientes et montre une sensibilité supérieure de 7 % de l’IA par rapport à la lecture des radiologues au prix d’une diminution de spécificité de 4 %. Cette perte de 4 % de spécificité pose cependant de gros problèmes dans l’utilisation de l’IA pour remplacer le radiologue dans le dépistage de masse organisé. Dans notre pratique clinique, le nombre d’examens anormaux pour masse séquellaire postopératoire, distorsion architecturale ancienne, macrocalcifications, microcalcifications de nature vasculaire, ou tout simplement clip rend absolument impossible l’utilisation de l’IA à la place du radiologue car cela entraînerait trop de faux positifs à gérer. La limite de ces différentes méta-analyses est qu’elles incluent des articles évaluant des solutions d’IA qui sont de niveau hétérogène aujourd’hui, même si elles sont développées sur le marché. Les résultats dépendent également de la performance et de l’expertise du radiologue auquel la solution d’IA est comparée. Une étude, dont la population est enrichie en nombre de cancers du sein, comparant l’IA aux performances de 101 radiologues est éclairante à ce propos(6). Si l’IA seule était supérieure à la lecture par le radiologue en moyenne, 35 % des radiologues faisaient mieux que l’IA. Les études focalisées sur la tomosynthèse sont beaucoup moins nombreuses et dans la méta-analyse très récemment parue(5), quatre études étaient relevées. Elles montrent des performances supérieures de l’IA en termes de surface sous la courbe, mais au prix d’une spécificité nettement diminuée, en effet si le gain en sensibilité était de 10 %, la perte en spécificité était de près de 20 % avec une spécificité de l’IA de seulement 63 % rendant impossible l’utilisation de l’IA seule dans l’interprétation de la tomosynthèse en dépistage de masse organisé. Enfin, dans un nouveau dépistage à la française substituant à l’imagerie 2D, la reconstruction 2D synthétique, il n’y a pas de donnée solide pour évaluer les performances de l’IA en imagerie 2D synthétique. En synthèse il n’y a pas aujourd’hui de place pour l’IA en substitution du radiologue dans le dépistage du cancer du sein par mammographie : les performances ne sont pas supérieures, les logiciels d’IA ne sont ni équivalents ni arrivés à maturité, le manque de spécificité rendrait inopérante une action de santé publique comme le dépistage, et enfin la question du responsable (radiologue ? développeur de la solution d’IA ?) serait prégnante en cas d’erreur diagnostique.   L’intelligence artificielle en support du radiologue Dans ce cadre, les radiologues utilisant l’IA en support de leur lecture, à l’origine du concept de radiologue augmenté. Les conclusions issues de la littérature sont tout à fait concordantes : le radiologue aidé de l’IA a des performances supérieures à celles du radiologue seul ou du logiciel d’IA seul, avec une augmentation de la sensibilité comme de la spécificité. Le gain de sensibilité pouvant aller jusqu’à 10 % (figure 1) alors que les gains de spécificité sont plus modestes(7). Ce gain à la fois en sensibilité et spécificité, rare lorsqu’est évaluée une nouvelle technique d’imagerie, doit être souligné.  À notre avis, pour utiliser pleinement le potentiel de l’IA, les conditions d’interprétation de la mammographie par le radiologue doivent être strictes : la mammographie doit être lue et interprétée par le radiologue dans un premier temps, puis les résultats de l’IA devront être regardés et les différentes marques montrées par l’IA analysées. Cette analyse est faite de façon relativement confortable dans notre expérience, puisque la lésion individualisée par l’IA est marquée, d’une part, avec une marque différente selon qu’il s’agit de microcalcifications ou d’une autre lésion identifiée, la présomption diagnostique est chiffrée sur une échelle numérique par l’IA et enfin lorsqu’une lésion a été identifiée sur la tomosynthèse le numéro de la coupe où la lésion a été dépistée par l’IA est donné.  a.  b.  c.  d.  e. Figure 1. Tumeur subtile supéro-externe gauche bien vue grâce à l’IA. Aucune lésion n’est évidente ni sur les clichés obliques (a), ni de face (b). L’IA identifie une masse de siège supéro-externe gauche sur la face et l’oblique gauche et sur la tomosynthèse en donnant le numéro de coupe ou la lésion est vue (c). A posteriori cette masse est bien vue (flèche) sur la coupe de tomosynthèse indiquée (d). L’échographie (e) a facilement identifié une tumeur ACR5 biopsiée sous guidage échographique avec un diagnostic de carcinome canalaire infiltrant. En pratique clinique, cela permet de négativer avec confiance la plupart des marques identifiées sur une analyse stricte, intégrant le contexte clinique et la comparaison avec les clichés antérieurs (figure 2) et de ne retenir que celles marquant une lésion véritablement suspecte.  a.  b. Figure 2. Faux positif de l’IA chez une patiente ayant des antécédents de cancer invasif traité par chirurgie et radiothérapie. Il existe sur le cliché oblique droit une distorsion architecturale (a) marquée par l’IA à risque élevé (b). Cette distorsion architecturale est parfaitement stable avec 10 ans de recul chez cette patiente opérée et correspond à une distorsion bénigne postopératoire.   L’intelligence artificielle pour sélectionner les mammographies pour lesquelles la lecture du radiologue est utile L’IA peut théoriquement être utilisée pour sélectionner les examens considérés comme à risque suffisant pour devoir être lus par les radiologues. Cette option repose sur le principe que les mammographies cotées comme ayant un score faible sur l’IA ont peu de risque de montrer un cancer lors de la lecture par un radiologue et qu’ainsi les radiologues pourraient se concentrer sur les mammographies à score élevé. Une revue systématique, publiée dans Radiology en 2022 évaluant les systèmes IA comme outil de triage a trouvé des résultats très variables : le nombre de mammographies considérées comme lisibles par l’IA sans nécessité d’un radiologue variait de 7 à 91 % avec un taux de cancer manqué variant lui de 0 à 7 %(8). Cette option n’a pas de sens dans un modèle français ou chaque femme bénéficie d’un examen clinique et potentiellement de clichés complémentaires ou d’une échographie avec un rendu des résultats dans le même temps mais pourrait être discutée dans des programmes de dépistage organisé, non médicalisé, en centre expert avec une interprétation différée(9). En revanche, il pourrait être intéressant d’utiliser l’IA comme examen de triage en alternative à la seconde lecture ; cette seconde lecture selon les départements en France détecte entre 5 et 10 % de cancers non décelés lors de la première lecture, elle pèse pour environ 20 % du coût global d’une campagne de dépistage. Plusieurs schémas peuvent être envisagés : radiologue augmenté grâce à l’IA en première lecture pour éviter la seconde lecture, première lecture par un radiologue et deuxième lecture centralisée réalisée uniquement par l’IA, deuxième lecture par un radiologue, réservée aux mammographies considérées comme suspectes. Les résultats intermédiaires de l’étude MASAI, très récemment parue en août 2023(10), proposent un scénario fiable pour l’utilisation de l’IA en alternative à la seconde lecture. Cette étude, la première prospective randomisée dans le champ de l’IA en mammographie, a inclus une population suédoise de dépistage avec deux bras : un dépistage classique sans IA avec double lecture, un dépistage avec IA pour lequel seules les patientes considérées à risque fort (score de 10 sur le logiciel d’IA Transpara) bénéficiaient d’une double lecture alors que celles avec un score inférieur à 10 n’avaient qu’une simple lecture. Les résultats intermédiaires de cette étude montrent un même taux de faux positifs dans les deux bras de 1,5 %, un taux non significativement plus important de cancers détectés dans le bras bénéficiant d’une IA (6 ‰ versus 5 ‰) mais surtout une diminution de 44 % du nombre de mammographies lues par les radiologues, permise par l’intégration de l’IA. L’intérêt de supprimer la double lecture au vu des conclusions de cette étude paraît clair ; mais il faut reconnaître que la double lecture a l’avantage d’homogénéiser, d’une part, et de hausser, d’autre part, le niveau de la première lecture, notamment en faisant la chasse aux clichés techniquement insuffisants.   L’intelligence artificielle permet-elle de diminuer le taux de cancers de l’intervalle ? Le taux de cancers de l’intervalle est un marqueur très important de l’efficacité d’un dépistage, il est considéré comme le meilleur reflet pragmatique de son impact sur le taux de mortalité. Intuitivement, il pourrait être supposé un faible effet de l’IA sur le taux de cancers de l’intervalle puisque l’IA dépisterait des lésions subtiles à vitesse de croissance faible, non vues par le radiologue. C’est aujourd’hui la faiblesse principale de la tomosynthèse. En réalité, les publications disponibles ne confirment pas cet a priori négatif. En partant de séries, certes, rétrospectives de cancer de l’intervalle et en soumettant à un logiciel les mammographies réalisées précédent l’identification du cancer de l’intervalle, près de 50 % des cancers de l’intervalle pourraient être évités(11,12) ; ces résultats sont concordants avec deux logiciels différents (Transpara, ICAD). La méthodologie rétrospective et le petit nombre de cancers inclus rendent les résultats relativement peu robustes et les résultats à venir de l’étude MASAI sus-citée, dont l’objectif principal est de comparer le taux de cancers de l’intervalle avec les deux stratégies de dépistage, restent très attendus.   L’intelligence artificielle dans la mesure de la densité mammaire La densité mammaire fait partie du compte rendu d’un examen mammographique. Les seins denses constituent un élément masquant, diminuant la sensibilité de la mammographie et justifiant donc la réalisation d’une échographie pour les seins de densité BIRADS C ou D. Par ailleurs, elle est reconnue comme un facteur de risque, modéré mais réel de cancer du sein, pouvant rentrer dans un modèle de risque sur lequel repose une surveillance personnalisée du cancer du sein. Or l’estimation de densité mammaire manque de reproductibilité aussi bien en inter- qu’en intra-observateur. Près d’une dizaine de logiciels sont disponibles pour déterminer la densité mammaire avec des performances égales à celles de radiologues experts(13) et nous pensons que la mesure de la densité mammaire doit impérativement être une possibilité offerte par les logiciels d’IA développés sur le marché.   L’intelligence artificielle intégré dans un modèle de prédiction de risque Le dépistage personnalisé, c’est-à-dire adapté au risque individuel de chaque patiente est un thème important de travail en sénologie, qui a d’ailleurs fait l’objet d’un colloque tenu à Montpellier en janvier 2023. La France est en avance sur cette évaluation d’un risque personnalisé avec l’étude my pebs qui repose sur : – des variables personnelles : âge, IMC, âge au premier enfant, antécédent de biopsie mammaire ; – des antécédents familiaux de cancer du sein ; – la densité mammaire radiologique ; – le génotypage avec un score de polymorphisme génétique réalisé à partir d’un prélèvement salivaire. Il est maintenant montré que la prédiction du risque est améliorée par l’IA. Une large étude norvégienne basée sur la cohorte KARMA a démontré l’intérêt d’un logiciel combinant densité mammaire, microcalcifications, présence de surdensité mammographique(14). Plus récemment une série rétrospective, incluant près de 2 500 patientes avec un cancer invasif et une population contrôle, a démontré l’intérêt de l’IA en plus de la densité mammaire pour déterminer à moyen terme (entre 2 et 5 ans) le risque de cancer invasif, particulièrement pour les cancers avancés. L’odd ratio était certes modéré de 1,2 mais significatif tant pour la mesure par l’IA de la complexité mammaire que pour la densité mammaire(15). Si aujourd’hui, en pratique clinique, la mesure de cette complexité mammaire par l’IA ne fait pas partie d’une évaluation du risque, comme c’est le cas par exemple pour les facteurs familiaux ou la densité mammaire, il est vraisemblable que dans les années à venir la complexité mammaire puisse être intégrée dans ce score. L’IA pourrait ainsi contribuer à mieux définir quatre populations : la population à très haut risque bénéficiant d’une IRM de dépistage, la population à risque dite intermédiaire bénéficiant d’un suivi plus serré, par exemple annuel, la population dite générale bénéficiant du suivi habituel et une population à très bas risque pour laquelle le suivi pourrait être espacé(16).   Est-ce que tous les logiciels d’intelligence artificielle ont la même performance ? Cette question est cruciale lorsqu’il s’agit d’implémenter l’IA dans le processus de dépistage de masse organisé. La réponse à cette question est très clairement non avec des différences entre les meilleurs et les moins bons logiciels bien plus importantes que les différences entre un radiologue expert et un radiologue généraliste dans l’interprétation d’une mammographie. Pour exemple, le Dream Challenge où 31 systèmes d’IA ont été comparés(17) avec, pour une spécificité fixée à 87 %, une sensibilité qui variait selon les logiciels entre 80 % pour les meilleurs et moins de 20 % pour les moins bons. De façon moins criante une étude(18) a comparé les performances respectives de trois solutions d’IA développées sur le marché sur une cohorte de plus de 8 000 femmes, cohorte enrichie en cancer (9 % de cancer), elle a montré pour une spécificité fixée à 96 %, une sensibilité de l’IA variant entre 67 et 82 %. De façon plus modeste, dans le colloque tenu à Montpellier en janvier 2023, une série enrichie avec une prévalence de cancer de 25 % a été proposée à 4 constructeurs présents sur le marché français (Incepto, ICAD, Therapixel et Hera-MI) ; pour une spécificité fixée, la sensibilité variait du simple au double selon les constructeurs.   Optimisation de la réalisation de la mammographie et simplification de son contrôle qualité Le développement des mammographes numériques intègre de principe l’IA en calculant la compression optimale afin de diminuer la dose, en diminuant le bruit dans l’image permettant à terme de s’affranchir de grille antidiffusante, ou en générant la reconstruction 2D synthétique à partir d’acquisitions de tomosynthèse. Par ailleurs, les industriels travaillent sur l’IA pour simplifier le contrôle qualité en mammographie et en tomosynthèse. En revanche, la plupart des systèmes d’IA sont incapables de gérer la non-qualité des clichés à analyser, en particulier en rapport avec un défaut de positionnement. Cependant, certains systèmes (Hera-MI par exemple) permettent d’indiquer aux manipulateurs que le cliché est insuffisant techniquement et nécessite d’être refait.   En conclusion, même s’il y a toujours un décalage entre les annonces des journaux grand public et la réalité, il nous faut constater que les solutions d’IA en mammographie se développent rapidement et sont utilisées par un certain nombre de radiologues de façon quotidienne et pas simplement dans le cadre d’évaluations scientifiques. Ces outils doivent être considérés comme une aide au radiologue, l’IA ne constituant pas une solution de substitution et ne nous exonérant en rien de notre responsabilité. L’intégration de l’IA dans une prédiction du risque pour adapter le rythme et le type de surveillance en dépistage et personnaliser la surveillance à ce risque estimé est certainement une voie d’avenir très stimulante intellectuellement. Cependant, les attentes pragmatiques principales nous paraissent être aujourd’hui le développement large et l’évaluation des solutions d’IA en tomosynthèse et en imagerie synthétique avec l’objectif d’atteindre une spécificité suffisante, la comparaison entre les deux seins, l’intégration des résultats obtenus sur les deux incidences complémentaires avec une correspondance entre le cliché de face et le cliché oblique, et surtout la comparaison avec les clichés antérieurs.

Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.

pour voir la suite, inscrivez-vous gratuitement.

Si vous êtes déjà inscrit,
connectez vous :

Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :

Version PDF

Vidéo sur le même thème