Lecture estivale: « L’intelligence artificielle, pas sans elles! »

J’ai découvert ce matin via mon fil Twitter l’ouvrage intitulé L’intelligence artificielle, pas sans elles! Faire de l’IA un levier pour l’égalité. Paru en mars dernier, ce court texte de 96 pages est le fruit d’une collaboration entre Aude Bernheim et Flora Vincent, docteures en microbiologie et chercheuses à l’Institut Weizmann en Israël, qui ont voulu explorer les mécanismes derrière les biais et préjugés sexistes reproduits par les algorithmes et l’IA.  Nous avons déjà exploré la question dans des dépêches précédentes, évoquant par exemple la problématique de la sous-représentation des femmes dans les équipes qui les produisent (ici et ici).

Voici une courte vidéo de Flora Vincent qui présente le propos de son ouvrage:

Les auteures débutent en constatant l’échec de l’égalité des sexes dans le domaine du numérique, plus particulièrement en informatique en lien avec le développement de l’IA.  En France, on ne retrouve que 10 % d’étudiantes dans le cursus informatique et 19 % en mathématiques.  Idem pour l’ingénierie où on voit 29 % d’étudiantes et seulement 11 % qui choisissent les secteurs de l’informatique et de la communication. L’écart dans les salaires entre les hommes et les femmes dans des postes de cadres dans le secteur de l’informatique y est moindre que dans d’autres métiers (5,5 % contre 19,5 % en moyenne), mais peu de femmes sont présentes dans ce rôle de leadership au sein des entreprises intéressées par l’IA.

Dans un chapitre intitulé « Où sont passées les femmes », Berheim et Vincent rappellent la contribution historique des femmes en informatique, en passant d’Ada Lovelace (qui travaillait avec Charles Babbage) qui a élaboré diverses méthodes pour résoudre des problèmes mathématiques à l’aide des premières machines à calculer, aux femmes ayant oeuvré à programmer les premiers « mainframes » tels qu’ENIAC (Kay McNulty, Betty Jennings, Betty Snyder, Marilyn Meltzer, Fran Bilas et Ruth Lichterman) ou encore Mary Allen Wilkes, qui fût la première à proposer un système d’exploitation pour miniordinateurs, précurseurs des ordinateurs personnels que l’on utilise aujourd’hui.  Plus récemment, Françoise Soulié-Fogelman a marqué l’histoire de l’exploration de données et c’est celle-ci qui supervisera les travaux de Yann Lecun, personnage maintenant reconnu mondialement pour ses recherches en IA.   Depuis 1966, seulement 3 femmes ont reçu le prestigieux prix Turing en informatique…  Les travaux de recherche des professeures Fei-Fei Li et Cordelia Schmid, toutes deux spécialistes de la vision par ordinateur, donnent espoir d’une nouvelle génération de chercheuses dans le domaine de l’IA pouvant rétablir un certain équilibre entre les sexes.

Le chapitre intitulé « Apprentissage sous influence » aborde de front le sujet des biais en rappelant que les bases de données ainsi que leur traitement « fourmillent de biais », selon les auteures du livre.  Ces biais ne sont pas qu’exclusivement liés au genre, mais sont aussi présents en raison de la sur-représentation de certains pays et de la langue d’usage parmi les programmeurs.  À titre d’exemple, 45 % des images utilisées par les systèmes de reconnaissance en IA sont produites aux États-Unis, qui ne représentent que 4 % de la population mondiale.  Les choix effectués par les programmeurs pour sélectionner les « meilleurs » étudiants sont un autre exemple éloquent où la prédiction par la machine à 100 % d’exactitude n’est pas possible sans créer ce que l’on appelle des faux positifs ou négatifs, soient des élèves qui sont acceptés ou non dans un programme en fonction de la moyenne obtenue dans leurs résultats scolaires.  Le problème devient plus complexe lorsqu’on veut inclure des critères additionnels, alors que l’équité des choix peut être questionnée.

Des solutions sont proposées pour aider à diminuer les biais, notamment en « forçant » les algorithmes à ne pas effectuer d’associations telles que « femme » et « cuisine » dans une base de données.  Cette action a toutefois pour effet de susciter des critiques qui vont questionner les choix et la position éthique des programmeurs, qui décident ultimement des cas de « forçage » qui pourraient ne pas refléter la réalité sociétale.  Une autre approche est celle de la voie légale, où on pourrait par exemple interdire la prise de décision autonome des machines, mais également limiter la portée du stockage et de l’exploitation des données de masse, comme l’a fait l’UE avec le Règlement général sur la protection des données (RGPD) entré en vigueur au printemps 2018.  Le sujet est brûlant d’actualité ici-même au Québec en raison de la fuite importante des données personnelles chez Desjardins, on comprend donc assez rapidement qu’il est important de pouvoir contrôler ces accès pour le bien de tous!

Je recommande fortement la lecture du livre à celles et ceux qui voudraient en savoir plus sur le sujet.

Source: @Elise sur Twitter, Les algorithmes et l’égalité, pour une intelligence artificielle non sexiste –> La création de biais dans les algorithmes. 19 juillet 2019.

Écoute estivale: l'analyse de l'apprentissage en soutien à la réussite étudiante
Littératie informatique : essai de compréhension

Exprimez-vous !

*