Google en sait-il plus que l’Insee sur les Français ?

En débat

Google en sait-il plus que l’Insee sur les Français ?

Les quantités de données enregistrées par les GAFAM sont immenses. Mais une partie de celles-ci n'ont qu'un intérêt qualitatif limité.

Dans le cadre des Journées de l'Économie 2020 (JECO) qui se dérouleront à Lyon du 17 au 19 novembre prochains, Jean-Luc Tavernier participera à la conférence « Google en sait-il plus que l’INSEE » (Mercredi 18 novembre à 9h). L'occasion de revenir sur ces évolutions technologiques qui entraînent une inflation des traces numériques des activités humaines, dans des champs de plus en plus étendus.

Les évolutions technologiques entraînent une inflation des traces numériques des activités humaines, dans des champs de plus en plus étendus. Les volumes de données enregistrées par les entreprises, notamment les GAFAM, sont considérables.

On peut penser notamment aux données de caisse de la grande distribution, aux transactions de cartes bancaires, aux connexions sur les réseaux des opérateurs de téléphonie mobile, aux requêtes des moteurs de recherche sur le web, à tous les services de géolocalisation présent sur nos smartphones, aux consommations d’électricité, au trafic routier, aux images satellites, etc.

Ces données présentent plusieurs attraits bien connus : leur disponibilité rapide, quasi-instantanée, leur homogénéité, au moins apparente, d’un pays à l’autre, leur coût marginal, proche de zéro, ou encore la charge de collecte insensible pour les particuliers ou entreprises concernées. On a vu par exemple le succès de Google Mobility pour illustrer la désaffection des consommateurs pour les centres commerciaux au cours de la crise sanitaire par exemple.

D’autres indicateurs ont connu une certaine notoriété durant cette crise, de façon plus ou moins méritée.

Google, un rival pour la statistique publique ?

Cette révolution numérique vient défier la statistique publique. Comme le trahit son étymologie, la statistique publique s’est en effet construite et organisée historiquement dans un environnement où l’État disposait de la capacité à collecter de l’information à l’échelle d’une nation, et à la traiter. Ce « monopole » est désormais remis en cause.

La statistique publique, Insee en tête, peut et doit naturellement tirer avantage des opportunités nouvelles qui s’ouvrent. Elle a commencé à le faire depuis plusieurs années, et elle a continué avec un effort et un discernement accrus depuis l’émergence de la pandémie, notamment pour suivre l’ampleur des chocs sur l’activité en temps réel.

L’apport de ces nouvelles sources d’information ne peut être jugé en bloc, toutes ont leurs spécificités propres. Elles ont déjà permis des avancées indéniables pour la statistique publique dans des domaines aussi variés que la mesure de l’inflation par l’utilisation des données de caisse de la grande distribution, ou encore de l’artificialisation des sols par des images satellitaires.

Mais l’expérience montre aussi que de l’information constituée par ces « traces numériques » à des savoirs robustes et utiles il y a un fossé important, parfois infranchissable.

D’autres sources ont ainsi montré un intérêt limité, comme la fréquence des requêtes sur les moteurs de recherche pour le suivi conjoncturel de l’activité économique.

Plusieurs caractéristiques, que l’on retrouve souvent avec ces nouvelles sources, expliquent pourquoi : lien trop indirect avec les grandeurs d’intérêts, absence de représentativité, instabilité et opacité des processus qui les génèrent1.

Les missions de la statistique publique ne se limitent pas à l’accumulation du plus grand volume possible d’information.

Elle reste et restera incontournable dès lors qu’il s’agit de rendre compte de phénomènes économique et sociaux précis ou complexes, de donner un cadre cohérent à la mesure de l’activité économique ou de la distribution des revenus, de produire de l’information représentative de l’ensemble de la population française, ou encore d’éclairer le débat public.

Pour aller plus loin1

- tout d’abord, il n’y pas de lien immédiat entre l’information et la grandeur économique à laquelle on souhaite la rapprocher ; une requête sur un moteur de recherche concernant un vêtement peut traduire une intention d’achat, mais elle peut aussi avoir d’autres motivations, et l’intention d’achat qu’elle peut signaler ne se concrétisera pas forcément ;

- ensuite, cela ne couvre par construction que les intentions d’achat des personnes qui utilisent internet, et ce moteur de recherche en particulier ; si l’utilisation d’internet, la part de marché du moteur et les comportements des consommateurs étaient stables dans le temps, cela n’aurait pas d’importance, mais cela fait beaucoup de « si » et c’est loin d’être le cas ; aucun échantillonnage ne permet de le contrôler ;

- enfin, les indicateurs disponibles sont construits de façon totalement opaque par le moteur de recherche, et sont aussi sensibles au process qui les génère (l’algorithme du moteur de recherche en question), qui lui évolue en permanence.

Biographie :

Jean-Luc Tavernier est directeur général de l’Insee depuis mars 2012. Ancien élève de l’École Polytechnique et de l’Ensae, inspecteur général des finances, il a réalisé une grande partie de sa carrière au ministère de l’économie et des finances, où il a été notamment directeur des politiques économiques de la direction générale du Trésor (2004-2005). Directeur général de l’Acoss (2005-2007), puis directeur de cabinet du ministre du budget (2007-2007), il devient commissaire général adjoint à l’investissement en 2010.

A propos des JECO :

Les Journées de l’Économie (Jéco), organisées par la Fondation pour l’Université de Lyon, rassemblent chaque année les meilleurs économistes de France et du monde pour proposer à un large public, dont de nombreux jeunes, des clés pour mieux comprendre le monde qui nous entoure.

Les Jéco, ce sont 3 jours de tables rondes et de rencontres pour débattre des grands sujets d’actualité économique et sociale. Etant donné le contexte sanitaire actuel, cette nouvelle édition des JECO, qui se déroule du 17 au 19 novembre passe en 100% digital. Les Journées de l’Economies 2020 sont ainsi accessibles à tous, gratuitement, sur inscription en ligne : http://www.journeeseconomie.org

Retrouvez Jean-Luc Tavernier lors des conférences :

Mesure et perception de l’inflation : Mardi 17 novembre de 17h à 18h30

Google en sait-il plus que l’INSEE ? : Mercredi 18 novembre de 9h à 10h30

Faut-il choisir entre solidarité et efficacité ? Mercredi 18 novembre de 17h45 à 19h30

http://www.journeeseconomie.org