Point chaud / en émergence Technologique

À quand une Faculté de la science des données ?

Pour le professeur de statistiques à l’Université de Harvard Xiao-Li Meng, la science des données (data science) est un écosystème artificiel parce qu’elle est une création humaine qui s’appuie intensément sur l’informatique.  Si l’informatique a permis la création des choses extraordinaires, dont l’internet et l’intelligence artificielle, elle a aussi créé son lot de problèmes.

Meng raconte la blague suivante.  Une université aurait utilisé pour sa campagne de recrutement d’étudiants au premier cycle cet argument :

Si vous voulez résoudre tous les problèmes du monde, inscrivez-vous en informatique

Pour sa campagne aux cycles supérieurs, la même université a retenu cet argument :

Si vous voulez résoudre tous les problèmes causés par l’informatique, inscrivez-vous dans un programme d’études supérieures en arts et en sciences.

La science des données est un domaine immense, complexe et interconnecté. Meng, qui a fondé la Harvard Data Science Review (HDSR), lui a donné cette devise “Everything data science and data science for everyone” qu’on peut traduire par « Tout est science des données et la science des données pour tous ».  Les données sont partout et affectent nos vies au quotidien, la vie de tout le monde et pas simplement les universitaires ou les spécialistes.  En effet, tout le monde génère des données et beaucoup de gens désirent avoir accès à des données. Meng n’a aucun doute sur le fait que tout le monde devrait avoir un minimum de connaissances en science des données.

[E]veryone should have some familiarity, but data science is not just about the traditional statistics, computer science, or STEM fields. If you think in that narrow way, you’d exclude a lot of people. We need to think about all the ways questions are being raised. There is now a whole area called “algorithm politics”, related to algorithm fairness, accountability, interoperability, accessibility, etc; and a lot of that are legal scholars’ or philosophers’ job. Therefore, there are lots of entry points to data science. The HDSR board consists of literally legal scholars, philosophers, all the way to quantum physicists. You don’t have to be the one doing the mathematics or statistics to be part of the data science community. It’s like many people are good wine connoisseurs but most of them don’t know the chemistry or how the wine is made, but they know enough to appreciate wine.

Meng se désole de la lenteur des universités à créer des programmes de formation à la science des données.  Les programmes existants sont influencés soit par des statisticiens, soit des informaticiens, soit des ingénieurs…  C’est bien, dit-il mais il faut dépasser de cette idée que la science des données peut devenir un nouveau département d’une faculté : c’est une nouvelle faculté à elle seule.  C’est d’ailleurs ce que fait l’Université de Californie à Berkeley : creating a division of data science – it’s university wide, a new school – recognizing that data science permeates other fields and requires this scale.  La formation à la sciences des données vaut aussi pour les bibliothécaires, les éditeurs, dont le travail est fortement « secoué » par les données.  Connaître les données, c’est plus que savoir programmer ou analyser les données, c’est comprendre l’univers des données, ses interactions avec les individus, ses impacts sur la prise de décisions et sur l’art de persuader.

À la question de Schonfeld sur ce qui l’inquiète le plus avec la science des données, Meng répond la sélection des données pour soutenir son argument, son idée, son hypothèse, pour prouver son point…  C’est ainsi qu’on assiste à des affirmations contradictoires : le café est mauvais pour vous dans un article et bon pour vous selon une autre recherche. Tout dépend de comment on fait les sélections de données à analyser.  Le problème n’est pas nouveau, mais il se fait maintenant à un niveau sans précédent, ce qui fragilise, entre autres choses, la crédibilité de la science.

On est ici, avec la science des données, dans la littératie informatique : lire l’excellent article de mon collègue Marc Couture dans le Perspectives SSF de décembre 2019 La littératie informatique : pour faire face aux données.

Quelques programmes québécois en science des données

Source – Schonfeld, Roger, C.  The Data Science Revolution : An Interview with Xiao-Li MengThe Scholarly Kitchen.  16 janvier 2020.

L'analytique des données étudiantes ne suffit pas sans soutien-conseil
Une liste à cocher pour enseigner en ligne : retour vers le futur?

À propos de l'auteur

Sonia Morin

Sonia Morin

1 commentaire

Répondre à Marc Couture X

Praesent felis id, facilisis id felis amet, non ut mattis libero. efficitur.