Un scandale révélé en 2014 par un chercheur français (120 manuscrits écrits par un robot auraient été publiés dans des actes de colloques à l’aide d’un logiciel portant le nom de SCIgen) a inspiré un biologiste moléculaire slovène et entrepreneur à la tête de sciNote, une PME technologique qui offre des « lab-books » numériques. Kelem Zupancic s’est dit qu’il serait certainement possible de créer un logiciel qui pourrait écrire de vrais articles scientifiques et il s’est lancé dans l’aventure. En novembre dernier, il a lancé Manuscript Writer : un outil numérique qui consulte les documents référencés, les données et les protocoles qu’un chercheur a versés dans son sciNoTE et relie différents éléments de manière à rédiger un brouillon d’article scientifique. Comme le robot rédacteur apprend de ses erreurs, que ce soit par les corrections que l’auteur lui apporte ou par des comparaisons avec des articles publiés, on peut espérer qu’un jour Manuscript Writer réussira à produire un texte d’une qualité s’apparentant à la qualité moyenne des articles rédigés par des humains.
On n’en est pas là mais, comme le souligne Engber, auteur de l’article à la source de la présente dépêche, cette perspective est souhaitable : [h]umans may be essential when it comes to formulating theories to explain results, but the rest of scientific writing—from a paper’s introduction through its description of experiments, methods, and results—would likely benefit from automation.
D’autant plus, ajoute Engber, que la qualité de la prose scientifique actuelle est particulièrement piètre. Plusieurs facteurs peuvent expliquer cette mauvaise prose : le jargon inhérent à chaque surspécialisation; l’obligation quasi absolue de l’utilisation de l’anglais comme langue de publication et ce, par des chercheurs quelles que soient leur culture d’origine; le recours à un modèle universel de rédaction (intro, métho, résultats, discussion). Et on en arrive aujourd’hui à des articles scientifiques qui se ressemblent tous et qui visent essentiellement à présenter des données. Cette uniformité pourrait être l’élément qui favorisera l’automatisation de certaines parties d’un texte scientifique.
En sciences biomédicales seulement, il existe 24 millions de sources référencées et 15 millions de scientifiques qui rédigent des articles. Personne ne peut absorber cette explosion des connaissances, même dans une surspécialisation très finie; cette impossibilité constitue un autre facteur pouvant jouer en faveur d’une automatisation de la rédaction. Heureusement le robot lecteur existe déjà, qui permet de faire une recherche documentaire très précise à travers des millions de résumés.
Jusqu’où ira l’automatisation ou la « robotisation » dans la publication scientifique? L’an dernier, un groupe de chercheurs de l’Université de Trieste a présenté ses travaux sur l’automatisation du processus d’évaluation par les pairs. Engber n’en dit pas plus pour le moment. C’est donc à suivre.
Sa conclusion, toutefois, mérite d’être citée :
Once robot referees have improved enough, they can peer review our robot-written papers. From there, the next step should be obvious: robot science journalists to robo-write surprising takes on the latest science news.
Serons-nous pour autant à l’abri des “fakes news”?
Source
Engber, Daniel. Humans Run Experiments, a Robot Writes the Paper. Slate. 12 décembre 2017.