Conditions de travail des annotateurs d’IA

Il est souvent mentionné que l’industrie qui permet le développement de l’intelligence artificielle (IA) entre en conflit direct avec les objectifs de développement durable des Nations-Unies. Outre le fait que les centres de données contribuent au réchauffement climatique, on doit constater que la façon dont fonctionne l’annotation nécessaire à l’entraînement des IA s’oppose assez directement aux objectifs no.1 (Pas de pauvreté) et no.9 (Industrie, innovation et infrastructure), pour ne mentionner que ceux-là. Des articles publiés récemment dans La presse et L’actualité expliquent bien comment fonctionne cet entraînement et à quel point le travail des annotateurs peut s’avérer aliénant.

Penser comme des machines pour former les machines
En gros, il s’agit pour l’humain de choisir entre deux ou davantage de réponses possibles suggérées par l’IA de manière à indiquer à la machine quelle est la réponse qui fait le plus de sens pour un humain.« Cette technique tortueuse est appelée « apprentissage par renforcement à partir de la rétroaction humaine », ou RLHF (pour reinforcement learning from human feedback)… » (Dzieza, 2024)

« Le travail de l’annotateur consiste souvent à mettre de côté la compréhension humaine et à suivre les instructions très, très littéralement — à penser, comme dit un annotateur, comme un robot. Et faire de son mieux pour suivre des règles absurdes mais rigoureuses, ça mène à un drôle d’état mental. Les annotateurs se retrouvent invariablement devant des questions déroutantes telles que : est-ce une chemise rouge à rayures blanches ou une chemise blanche à rayures rouges ? Un bol en osier est-il un “bol décoratif” s’il est rempli de pommes ? De quelle couleur est l’imprimé léopard ? Lorsque les instructions disent qu’il faut étiqueter les signaleurs routiers, doit-on aussi étiqueter ceux qui mangent sur le trottoir ? Il faut répondre à chaque question, et une supposition erronée peut vous faire bannir et vous envoyer vers une tâche totalement différente, avec ses propres règles déconcertantes. » (Dzieza, 2024)

Or, ce travail de moine est à la base des modèles prédictifs que sont notamment les IA génératives: « L’annotation reste un élément fondamental de l’élaboration de l’IA. Toutefois, les ingénieurs la considèrent souvent comme un préalable casse-pieds au travail plus prestigieux de construction de modèles. On collecte autant de données étiquetées que possible à moindre coût pour entraîner le modèle, et s’il fonctionne, on n’a plus besoin des annotateurs. Du moins en théorie. Car l’annotation n’est jamais vraiment terminée.» (Dzieza, 2024) D’ailleurs, Edwin Chen, PDG de Surge AI, firme derrière la plateforme Remotasks, croit que cet apport humain n’est pas prêt de disparaître, « mais il s’attend à ce que l’annotation devienne plus difficile au fur et à mesure que les modèles évolueront ». (Dzieza, 2024)

Un travail qui ne fait pas de sens

« Chacun de ces taskers – surnom donné par Remotasks [à ses sous-contractants] – est rémunéré quelques cents par tâche et voit son pécule versé par PayPal, en dehors de son système bancaire local. Aucun de ces sous-traitants n’est formellement salarié par la jeune pousse californienne, qui peut ainsi s’affranchir des législations nationales. » (Simon, 2024)

Alors que les Nations-Unies définissent le « travail décent » comme « la possibilité pour chacun d’obtenir un travail productif et un revenu équitable, la sécurité sur le lieu de travail et la protection sociale pour les familles, de meilleures perspectives de développement personnel et d’intégration sociale », un travail comme l’annotation d’IA qui s’avère « dépourvu de sens ou d’objectif, qui devrai[t] être automatisé, mais qui ne l'[est] pas pour des raisons de bureaucratie, de statut ou d’inertie » (Objectif no.8 Travail décent et croissance économique) correspond davantage à ce que l’anthropologue anarchiste David Graeber définissait en 2018 comme des bullshit jobs. (Dzieza, 2024)

Ajoutons que, pour des raisons de concurrence, les annotateurs ne sont pas informés de ce sur quoi ils travaillent. C’est que « [l]es annotations peuvent révéler trop de choses sur les systèmes en cours de développement, et le nombre considérable de travailleurs requis rend les fuites dures à prévenir. » Difficile alors de trouver un sens à ces micro-tâches, hyper-divisées: « Chaque mandat était une composante tellement petite d’un processus beaucoup plus large qu’il était dur pour ces travailleurs de dire à quoi ils entraînaient réellement l’IA. Les noms de dossiers n’offraient guère d’indices : Crab Generation, Whale Segment, Woodland Gyro et Pillbox Bratwurst. Des noms de code sans logique, pour un travail qui n’en avait pas davantage. » (Dzieza, 2024)

Un travail irrégulier pour toujours plus de gens
Pour un revenu sécuritaire, ne devenez pas « annotateur »: «La plainte la plus fréquente concernant le travail sur Remotasks est en effet son irrégularité… […] Les annotateurs passent des heures à lire des instructions et à suivre des formations non rémunérées, pour ensuite effectuer une douzaine de tâches avant de voir le mandat se terminer. Parfois, rien ne bouge pendant des jours, puis, sans avertissement, une nouvelle tâche se présente et nécessitera de quelques heures à plusieurs semaines. Chacune peut être la dernière. Ils ne savent jamais quand la prochaine arrivera. »

Selon Dzieza (2024), «[i]l n’existe pas d’estimation précise du nombre de personnes travaillant dans le domaine de l’annotation, mais il serait élevé et en croissance : dans une récente publication, Google Research a parlé de « millions », qui pourraient évoluer vers des « milliards ».

Un travail qui n’améliore en rien l’économie des pays où il est pratiqué
Joe, l’informateur kenyan de Dzieza (2024), s’inquiète de ne bientôt plus avoir de tâches offertes dans son pays par la plateforme Remotasks… « Des collègues rencontrés en ligne lui ont appris que des tâches étaient dirigées vers le Népal, l’Inde et les Philippines. « Les entreprises passent d’une région à l’autre, explique Joe. Elles n’ont pas d’infrastructures locales, elles vont vers des régions qui leur sont favorables en matière de coûts d’exploitation. » La chaîne de production peut être reconfigurée à l’infini et instantanément, en se déplaçant là où se trouve la bonne combinaison de compétences, de bande passante et de rémunération. »

Et, bientôt déjà, les Philippines seront passées de mode: « Interrogé sur les pratiques de Remotasks, le responsable local [philippin] de l’inspection du travail, Atheneus Vasallo, suspecte un recours massif à du travail dissimulé et promet d’ouvrir une enquête. En cas de problème, Remotasks ne manquera pas de solutions de rechange : l’entreprise a récemment ouvert des bureaux au Nigeria et au Venezuela, où la main-d’œuvre est encore moins chère qu’aux Philippines. » (Simon, 2024)

Sources:
Dzieza, Josh (31 janvier 2024), « Combien d’humains faut-il pour créer une IA? », L’actualité (version originale parue dans The Verge, 20 juin 2023)

Simon, Théophile (28 janvier 2024), « C’est de l’exploitation », Lapresse.ca