Brève

Kernix est heureux d'avoir remporté le data challenge dédié au cartilage thyroïdien organisé à l'occasion des Journées Francophones de Radiologie 2018 ! Ce challenge d'intelligence artificielle autour de l'imagerie médicale était organisé par la Société Française de Radiologie en partenariat avec le centre Gustave Roussy et Centrale Supélec, et avait pour objectif de mettre en concurrence des équipes pluri-disciplinaires à travers cinq sujets de détection d'anomalie sur des IRM.

Kernix a participé à ce challenge au sein de l'équipe SynovIA dont faisait également partie le professeur Alain Blum, chef du service imagerie Guilloz du CHU de Nancy. La collaboration avec des radiologues tout au long de ce projet nous a permis d'acquérir une compréhension approfondie des problématiques en jeu et de mettre en place la méthodologie la plus appropriée. Notre approche de Deep learning nous a permis de détecter avec succès les anomalies sur des IRMs de cartilage thyroïdien.Cette démarche sera récompensée par une publication en fast track début 2019 dans la revue DIAGNOSTIC AND INTERVENTIONAL IMAGING !


Contexte

Les journées francophones de radiologie se sont déroulées durant le week-end du 12 au 14 octobre 2018. C'est un lieu de rencontre idéal pour les radiologues et les industriels de l'imagerie médicale pour venir échanger autour des besoins des praticiens et des dernières innovations. Cette année, les avancées de l'intelligence artificielle étaient dans tous les esprits. En effet, la profession fait face à une pénurie de radiologues, soumettant ces derniers à des cadences toujours plus élevées tandis que les patients peuvent voir la qualité du service se dégrader. Les applications de l'intelligence artificielle pourrait permettre d'éviter au radiologue les tâches redondantes et chronophages, comme le traitement des informations du patient.

Les radiologues attendent ainsi de l'IA un gain d'efficacité afin de pouvoir se concentrer sur le coeur de leur métier, tout en réduisant les erreurs de diagnostic dû au manque de temps. C'est dans ce contexte qu'a été organisé le challenge IA de ces JFR : comment améliorer le diagnostic sur des images médicales en utilisant le deep learning ? Pour répondre à cette question, cinq thématiques ont été proposées : le cortex rénal, les fissures du ménisque, la radiographie mammaire, le cartilage thyroïdien et les lésions hépatiques. Dans chaque cas, il s'agit de repérer ou estimer une lésion ou une anomalie à partir d'images de scanner ou IRM. Les équipes participantes avaient donc pour objectif de proposer des algorithmes pouvant diagnostiquer des centaines, voire des milliers d'images. A terme, ce type de solution pourra être utilisé pour accompagner le radiologue dans un pré-diagnostic : dans le cas de la pathologie très courante de la fissure du ménisque, un algorithme donne un score à chaque image IRM pour refléter la probabilité de présence d'une fissure. Les résultats que nous avons obtenus dans cette pathologie ont une précision1 pour laisser entrevoir de telles applications.


Déroulement du challenge

Les organisateurs du challenge ont pu rassembler des jeux d'images sur chaque challenge auprès de différentes institutions de santé, malgré les difficultés dues au caractère sensible des données médicales. Une fois les données récoltées en nombre suffisant, les équipes se sont formées durant l'été, en mettant en relation des professionnels de l'IA avec des radiologues. Kernix s'est joint au service de radiologie du Dr Blum au CHRU de Nancy pour constituer l'équipe SynovIA.

Ce challenge regroupait des acteurs majeurs du domaine : IBM Watson, Facebook Research, Quantmetry… créant une émulation intéressante autour du challenge pour démontrer la puissance des outils issus du monde de l'IA et de la Data Science. Nous nous sommes ainsi reposés sur une démarche éprouvée chez nous : une compréhension des enjeux métiers par des échanges réguliers avec les radiologues, combinée à une expertise technique multidisciplinaire.

L'équipe du Dr Blum étant spécialisée dans les pathologies du ménisque, nous avons donc choisi naturellement de porter notre attention sur ce thème. L'objectif pour ce challenge est de prédire la présence d'une fissure sur une image IRM, de préciser sur quel ménisque elle se trouve et son orientation. Nous nous sommes aussi intéressé au challenge de la thyroïde en détectant une anomalie (classification binaire). Peu d'équipes l'ont abordé du fait de l'inhomogénéité des images : la forme de la thyroïde et de la trachée pouvait être sensiblement variable. Par ailleurs, il était même difficile pour les radiologues de prédire la présence d'une anomalie sur les thyroïdes. Mais ne serait-ce pas justement le plein intérêt d'un algorithme de deep-learning : affiner le diagnostic du médecin ?

Les échanges avec le Dr Blum et son équipe nous ont permis de comprendre et d'interpréter les images. Cette étape d'échange avec les métiers est indispensable à tout projet data en permettant la compréhension fine des contraintes du challenge.


Exploration des données

Le challenge sur le ménisque comportait environ 1500 images d'IRM et celui sur la thyroïde en proposait le moins avec environ 500 IRM. Les images étaient globalement uniformes et centrées, ce qui facilitait leur traitement. En plus des images, nous avions un tableau avec les informations cibles (présence de fissure, sur quelle corne du ménisque, son orientation, la coupe de l'IRM).

Pour le ménisque, nous avons séparé les IRM en deux (parties haute et basse) puis réalisé un recentrage sur les cornes respectives (antérieure et postérieure) ainsi qu'un lissage de l'intensité. Un cropping selon des coordonnées fixes était suffisant étant donné l'uniformité des images et nous permettait de gagner du temps par rapport à une détection automatique de la zone du ménisque.

L'expertise des radiologues du CHU de Nancy nous a été très précieuse durant ce challenge afin de comprendre comment analyser les IRM et reconnaitres les anomalies, autrement dit quels motifs notre modèle allait devoir tenter d'identifier. Comme pour tous nos projets, nous avons pris soin de dédier le temps nécessaire à l'exploration des données au regard de la problématique. Voici un exemple du type d'images dont nous disposions :

Ménisque

Figure 1 : exemples d'IRM

IRM d'un ménisque sain IRM d'un ménisque fissuré sur la corne postérieure

Les IRM ci-dessus ont été réalisées selon une coupe dite "sagittale", comme illustré sur la coupe ci-dessous :

Figure 2 : Représentation de la coupe de l'IRM

(Source : Automated Segmentation of the Meniscus - Felicia Aldrin)

Un ménisque sain est caractérisé par deux triangles dont la partie intérieure est sombre et homogène (voir figure 1 gauche), à l'inverse une fissure est caractérisée par une perturbation de l'homogénéité de cette zone à travers des zones blanches (voir figure 1 droite). La difficulté reposait dans la possible présence de kystes ou anomalies génétiques se manifestant de la même manière sans être des fissures.

Les traitements suivant ont été appliqués aux images d'IRM avant entraînement de l'algorithme (voir figure 3) :

  • Découpage des IRM en deux (parties haute et basse)
  • Recentrage sur les cornes respectives (antérieure et postérieure) selon des coordonnées fixes.
  • Génération de nouvelles images en appliquant des transformations sur les originales (rotations, translations etc…) pour améliorer la robustesse du futur modèle.
  • Uniformisation de l'intensité sur l'ensemble des images car nous avions constaté des différences de luminosité.

Figure 3 : recentrage sur le ménisque

Le jeu de données a été séparé en échantillons d'entraînement (à partir duquel nous avons généré des images) et de test pour pouvoir évaluer les performances du modèle. Les images issues d'une même coupe étaient placées dans le même échantillon.

Thyroïde

En ce qui concerne la thyroïde, voici un exemple des images dont nous disposions (environ 500 en tout) :

Figure 4 : exemples d'IRM de la thyroïde (Source : EURORAD)

IRM de la thyroïde (cartilage normal) IRM de la thyroïde (cartilage anormal)

Le problème de la thyroïde était particulièrement compliqué du fait du faible volume de données à disposition mais également de la difficulté du diagnostic qu'il est possible d'en déduire. En effet, les images étaient très disparates, ce qui est du à la variation de la forme du cartilage et la manière dont la coupe a été réalisée. La caractérisation de l'anomalie se fait donc différemment en fonction du type de coupe IRM. Des exemples de coupe sont illustrées dans la figure 6 ci-dessous :