Petit guide de la terminologie d'IA

Petit guide de la terminologie d'intelligence artificielle

Apprendre à connaître les concepts de base de cette technologie

Auteur : Dr Will Guest, membre du groupe de travail de la CAR sur l'intelligence artificielled


Will Guest
10 septembre 2017

Les radiologistes ont l'habitude d'utiliser un vocabulaire spécialisé pour décrire précisément leurs observations et les communiquer aux autres radiologistes, aux médecins traitants et aux patients. La technologie de l'intelligence artificielle (IA) est de plus en plus répandue. Elle s'intégrera au travail clinique des radiologistes et ils devront alors apprendre à connaître, au moins de façon générale, les concepts de base de cette technologie. Il serait judicieux de commencer par comprendre la terminologie fréquemment employée en IA. Voici donc quelques termes qui pourraient bientôt entrer dans le lexique des radiologistes :

L'apprentissage machine est devenu en quelque sorte un mot fourre-tout pour désigner l'automatisation informatique d'une fonction cognitive auparavant réalisée par des êtres humains. Cependant, contrairement à un programme informatique qui exécute une série d'opérations à partir de données d'entrée, un algorithme d'apprentissage machine doit aussi être capable d'améliorer son rendement pour effectuer la tâche à réaliser à mesure qu'on lui fournit de nouvelles données. Pour ce faire, on règle de façon itérative les paramètres dans l'algorithme afin d'optimiser la qualité de l'ajustement entre les caractéristiques des données que l'algorithme tente de classer et les prédictions de l'algorithme. Ce processus est possible par apprentissage supervisé, lorsqu'un ensemble de données d'essai est étiqueté par des humains pour décrire les données de sortie souhaitées, ou par apprentissage non supervisé, lorsqu'aucune étiquette n'est appliquée aux données et que l'algorithme tente de les regrouper ou de les trier pour en révéler les logiques sous-jacentes.

Une panoplie d'outils informatiques existent pour appliquer le concept d'apprentissage machine, mais la technique qui suscite le plus d'intérêt actuellement est le réseau de neurones artificiel, nommé ainsi par analogie avec les neurones interconnectés dans un système nerveux biologique. L'élément de base d'un réseau de neurones est le neurone artificiel, une structure relativement simple qui prend diverses données d'entrée (soit les données fournies au réseau, soit celles d'autres neurones artificiels) et détermine si le neurone doit s'activer (et, dans certains modèles, à quel degré le faire) en évaluant ces données d'entrée par rapport à un biais qui détermine l'excitabilité du neurone. Les données de sortie de ce neurone peuvent servir de données d'entrée à d'autres neurones ou être regroupées avec les données de sortie d'autres neurones (par des opérations mathématiques, comme une fonction softmax qui amplifie le signal le plus fort du groupe de neurones) pour produire les données de sortie finales du réseau.

La complexité des réseaux de neurones découle du grand nombre de neurones qui le constituent et de l'organisation des neurones dans le réseau. Dans un réseau de neurones typique, les neurones sont disposés en groupes qu'on nomme des couches, qui reçoivent leurs données d'entrée de neurones de la couche inférieure et envoient leurs données de sortie à des neurones de la couche supérieure (sans connexions directes entre les neurones d'une même couche). On appelle ces réseaux des réseaux de neurones à propagation avant, car l'information circule dans une seule direction au sein du réseau, soit de l'entrée des données dans le réseau jusqu'à la production des données finales du réseau, en passant par une suite de couches intermédiaires. Par opposition, on appelle réseau neuronal récurrent un réseau où l'information circule dans les deux sens entre les neurones. Les couches intermédiaires qui n'acceptent pas directement les données d'entrée du réseau et ne produisent pas de données de sortie finales portent le nom de couches cachées. On dit d'un réseau comportant plusieurs couches cachées qu'il est profond.

En analyse d'images, les réseaux de neurones convolutifs sont devenus des outils populaires en raison de leur capacité à identifier les caractéristiques d'images sur plusieurs échelles. Dans de tels réseaux, un neurone traite les données d'entrée à partir d'un groupe de pixels, son champ récepteur (comme les cellules ganglionnaires de la rétine), et applique des filtres mathématiques qu'on appelle convolutions, qui amplifient certaines caractéristiques de l'image dans le champ récepteur (comme des lignes, contours, ou textures). Les couches de neurones sont disposées selon un ordre hiérarchique. Ainsi, les premières couches ont de petits champs récepteurs, tandis que les dernières couches traitent des données d'entrée regroupées pour analyser une plus grande portion de l'image (par exemples des lésions ou organes entiers). Les réseaux profonds dotés de ce type d'organisation hiérarchique sont des exemples d'apprentissage profond.

Une architecture inhabituelle, mais puissante de réseau neuronal est l'auto-encodeur, qui tente de régénérer, dans ses données de sortie, l'image reçue comme donnée d'entrée. Cet exercice peut sembler futile, mais son importance tient à la configuration du réseau de façon à ce qu'une des couches cachées intermédiaires compte moins de neurones que la couche d'entrée ou de sortie. Les neurones de sa couche cachée sont formés pour réagir aux attributs les plus descriptifs de l'image, ce qui permet à ces modèles d'effectuer une extraction des caractéristiques. Mais surtout, puisque les données d'entrée et de sortie des auto-encodeurs sont identiques, ceux-ci n'ont pas besoin d'ensembles de données d'apprentissage étiquetés par des humains et sont ainsi aptes à l'apprentissage non supervisé.

Les applications de l'apprentissage machine en radiologie se limitent habituellement à quelques domaines : la détection, où l'objectif est de repérer une structure dans une image (par exemple, un nodule pulmonaire), la classification, où une image ou une lésion dans une image sont classées dans une catégorie (par exemple, y a-t-il ou non embolie pulmonaire sur cet examen de TDM?), la segmentation, où une structure d'intérêt est isolée du reste de l'étude (comme les lignes définissant les contours d'un organe) et le recalage, où on cherche à optimiser les concordances entre les images de différents examens (effectués selon des méthodes différentes ou à divers moments dans le temps) pour faciliter la comparaison entre les deux.

Voilà donc un aperçu de certains des concepts et des termes utilisés dans les applications d'IA en radiologie. J'espère avoir piqué votre curiosité et vous avoir incité à explorer ce domaine émergent!

 

Retour à la page d'accueil du bulletin électronique