En terminale ES, Clarice Hayrabédian rêvait d’exercer un métier qui concilie son amour pour les mathématiques et l’économie. Elle découvre la profession de data scientist en 2016, à travers des cours en dernière année de bachelor « économie et statistiques » à la Toulouse School of Economics, mais aussi dans la presse. La « révolution big data » bat son plein.
« Data » veut dire données, et « big » signifie que la numérisation, le développement des réseaux sociaux, l’apparition d’objets connectés (smartphone, par exemple) produisent des montagnes de données. Achats, déplacements, goûts musicaux… aujourd’hui, tout se sait. L’information est stockée et peut être traitée. Si l’information c’est le pouvoir, alors le big data pourrait bien être le nouveau pétrole.
À la différence que cette ressource est inépuisable. Comme le soulignait dès 2010 Éric Schmidt, l’ancien PDG de Google, « nous produisons en deux jours autant de données que nous en avons généré entre l’aube de la civilisation et 2003 ». Mais pour avoir de la valeur, ces données doivent être traitées, de même que le pétrole doit être raffiné. Et c’est justement la mission du data scientist.
En terminale ES, Clarice Hayrabédian rêvait d’exercer un métier qui concilie son amour pour les mathématiques et l’économie. Elle découvre la profession de data scientist en 2016, à travers des cours en dernière année de bachelor « économie et statistiques » à la Toulouse School of Economics, mais aussi dans la presse. La « révolution big data » bat son plein.
« Data » veut dire données, et « big » signifie que la numérisation, le développement des réseaux sociaux, l’apparition d’objets connectés (smartphone, par exemple) produisent des montagnes de données. Achats, déplacements, goûts musicaux… aujourd’hui, tout se sait. L’information est stockée et peut être traitée. Si l’information c’est le pouvoir, alors le big data pourrait bien être le nouveau pétrole.
À la différence que cette ressource est inépuisable. Comme le soulignait dès 2010 Éric Schmidt, l’ancien PDG de Google, « nous produisons en deux jours autant de données que nous en avons généré entre l’aube de la civilisation et 2003 ». Mais pour avoir de la valeur, ces données doivent être traitées, de même que le pétrole doit être raffiné. Et c’est justement la mission du data scientist.
Données de santé et feutres à coller
« Le data scientist crée un algorithme qui collecte les données jugées utiles, les trie, les organise et les restitue dans un tableau de bord. Celui-ci est utilisé comme un outil d’aide à la décision par des directeurs, les marketeurs, les commerciaux, les financiers et beaucoup d’autres métiers », explique Guillaume Chevillon, responsable du master « in data sciences et business analytics » de l’Essec et Centrale-Supélec.
Par exemple, à l’Institut Gustave-Roussy, premier centre européen de lutte contre le cancer, les data scientists collectent les données des patients (types de tumeurs et réactions au traitement), les centralisent et en tirent des enseignements. Grâce à ce travail, « il devient possible de prédire la réponse d’un patient à un traitement donné, et les risques de rechute. Cela permet au personnel soignant de proposer au plus tôt au patient le meilleur parcours de soins », pointe l’Institut.
La data a-t-elle des superpouvoirs ?
Anacrim et l’affaire du petit Grégory
Le 16 octobre 1984, Grégory, 4 ans, est découvert mort, pieds et poings liés, dans la Vologne, une rivière des Vosges. Le meurtrier n’a jamais été identifié. En juin 2017, coup de théâtre : les grand-oncle et tante du petit Grégory et sa tante par alliance sont mis en examen. Ce n’est pas l’ADN qui a parlé, mais les données qui ont été interprétées.
Les gendarmes ont entré les éléments de l’enquête dans Anacrim. Ce logiciel d’analyse des données a reconstitué l’emploi du temps de chacun des protagonistes et mis en évidence certaines incohérences. En mai 2018, la chambre de l’instruction de Dijon, au motif d’un vice de procédure, a toutefois annulé les mises en examen.
Cambridge Analytica : faiseur de rois ?
L’entreprise britannique de conseil en communication, fondée en 2013, s’est donné pour mission de « changer les comportements des individus grâce aux données ». Embauchée par l’équipe de Donald Trump lors de la dernière campagne présidentielle américaine, elle a recueilli les données de 30 à 70 millions d’utilisateurs Facebook à leur insu. Elle s’en est servi pour dresser des profils psychologiques et adapter aux sensibilités de chacun les messages du futur président. A-t-elle réussi à influencer le vote ? L’homme d’affaires a bien été élu. Mais les républicains Ben Carson et Ted Cruz, également clients de la société, ont échoué dans la course à l’investiture.
Autre monde, celui de l’assurance, et autre usage : en analysant les achats des assurés et en les croisant avec l’historique des sinistres, des data scientists ont constaté que les personnes achetant des feutres à coller sous les pieds des tables, conduisent de manière prudente.
Le sociologue Dominique Cardon, qui rapporte l’anecdote dans son ouvrage À quoi rêvent les algorithmes (Seuil, 2015), ne dit pas comment finit l’histoire. Toutefois, on peut imaginer que certaines compagnies décident de proposer des tarifs d’assurance auto attractifs aux acheteurs de feutres, le risque de sinistre étant réduit.

© DR
Des profils convoités
Pour exercer le métier, en plus d’être un as en mathématiques, statistiques, et informatique, il faut avoir de bonnes notions en économie. « Il est primordial de bien comprendre les besoins du client, les enjeux et les problématiques des métiers. Cela conditionne le reste, c’est-à-dire le choix des données à collecter, leur analyse et restitution », explique Clarice, aujourd’hui consultante en Data Science pour Octo Technology, un cabinet de conseil spécialisé en transformation digitale.
Ces profils ne sont pas faciles à trouver. Or la demande explose. « Aujourd’hui, tous les secteurs, les PME comme les grands groupes, les chassent. Le métier est en forte tension. La preuve, un data scientist débutant gagne 45 000 euros brut par an », souligne Frédéric Rei, en charge du secteur Technologies chez Michael Page, un cabinet de recrutement.
Quant aux parcours de carrière, ils font également rêver. « Plusieurs de nos anciens, diplômés en 2015, occupent aujourd’hui de hautes responsabilités dans les entreprises du CAC 40 : chief data analyst ou même directeur de l’innovation », pointe Guillaume Chevillon. Clarisse aussi a des ambitions. À court ou moyen terme, elle se verrait bien devenir chef de projet et manager une équipe.
Quelle formation ?
Les cursus pour devenir data scientist ont commencé à apparaître en 2014. Ce sont des formations de haut vol : niveau bac+5 voire bac+6. Polytechnique, l’université de Saclay, l’Ensae ParisTech, Telecom ParisTech proposent à leurs étudiants un master 2 Data Science. L’Essec et CentraleSupélec ont ouvert en 2015 leur Master in Data Sciences et Business Analytics. L’université ouvre aux titulaires d’un bac+2 un cursus de trois ans : MIAGE (méthodes informatiques appliquées à la gestion des entreprises). Il existe aussi quantité d’onéreux mastères spécialisés et MBA sur le sujet.