Insee : partenariat avec le privé, données personnelles, méthode de travail, le DG répond

Idées

Insee : partenariat avec le privé, données personnelles, méthode de travail, le DG répond

L’Institut de statistiques publiques collecte ses propres données en interne et extrait celles de bases administratives. Depuis quelques années, l’Insee pioche aussi dans des jeux mis à disposition par le secteur privé, mais les négociations ne sont pas toujours simples, nous confie Jean-Luc Tavernier, le directeur général. 

jeanluctavernierinsee2.png

Pourquoi lui ?

Jean-Luc Tavernier est directeur général de l'Insee depuis 2012. Il est économiste et a été inspecteur général des finances, directeur de l’École nationale de la statistique et de l'administration économique (l'ENSAE) et directeur du cabinet d'Éric Woerth au ministère du Budget. 

Pour l'Éco. Votre plus grosse enquête, le recensement annuel, est effectuée en interne et représente 17 % de votre budget. Pourquoi ce choix ? 

Jean-Luc Tavernier. Le recensement est une étude historique. Il s’agit d’avoir une information détaillée, par commune sur un certain nombre de caractéristiques et de phénomènes. Auparavant, nous la réalisions tous les 10 ans. Notre budget doublait ces années-là ! 

Plus on ambitionne de couvrir toutes les populations, plus il faut un échantillon large. C’est pour ça que le recensement est notre enquête la plus chère. Or, les moyens de l’Insee sont, depuis les années 2000, au mieux stables, sinon plutôt orientés à la baisse.

Au niveau des effectifs, on est 25 % en dessous du maximum que l’on a connu. Il a donc fallu faire un arbitrage sur la taille de l’échantillon. Pour lisser le coût budgétaire induit par le recensement, nous avons opté pour un rolling census en bon français, c’est-à-dire un recensement en continu. Nous ne couvrons que 14 % de la population, mais réalisons l’étude chaque année.

Éco-mots

Recensement

Opération par laquelle un institut public recueille et analyse avec exactitude des données démographiques, économiques ou sociales (nombre de logements, d’habitants, de personnes hébergées, leur profession et lieu de travail...) à un moment donné, dans un pays.

Cette restructuration budgétaire a aussi facilité l’organisation. Nous n’avons plus besoin d’embaucher des agents juste pour cette opération-là. Nous avons lissé la charge salariale. 

Aussi, nous investissons pour améliorer les méthodes et gagner encore un peu de budget. La moitié des gens répond désormais par Internet, ce qui réduit les coûts (et facilite la réponse par les ménages). On a plutôt essayé de faire des gains de productivité là où on pouvait mais ça a ses limites. À un moment donné, il faut bien aller interroger les ménages. 

Auparavant, des enquêteurs se déplaçaient dans les magasins pour relever les prix de la consommation. Désormais, la grande distribution vous fournit ces données. Comment se sont passées les négociations ? 

Un cadre juridique a été établi seulement très récemment, avec la loi pour la République numérique en 2016. Nous l’avons utilisé pour la première fois pour les données de caisse de la grande distribution. Il permet d’encadrer l’utilisation des données à des fins uniquement statistiques. Nous, l’Insee, ne pouvons pas les transmettre à quelqu’un d’autre, pas même à une autorité d’État.

Les données de caisses, par exception à tout ce qu’on a par ailleurs, nous ne les donnons même pas aux chercheurs. La grande distribution craignait qu’elles se retrouvent un jour chez Amazon. L’Insee comprend et partage cette prévention. Suite à ce cadre juridique, les conditions de la collaboration sont instruites, passent par différentes commissions contradictoires, etc. C’est plutôt bien fait. 

Éco-mots

Loi pour la République numérique 

Promulguée en octobre 2017, cette loi encourage la circulation des données et du savoir, la protection des individus dans la société du numérique et l'accès au numérique pour tous.

Désormais, plutôt que d’envoyer des enquêteurs scanner les prix de chaque produit, on reçoit automatiquement toutes les transactions qui ont été faites dans la journée, à la fois en volume et en valeur, par lieu de diffusion. Ça évite d’avoir ce travail de relevé à faire, et ça permet d’avoir l’information vite, évidemment. C’est un partenariat de quelques années, avec toutes les enseignes, Carrefour, Auchan, etc. 

Nous avons depuis peu accès aux données de cartes bleues. L’Insee souhaitait traiter ces informations depuis longtemps, mais c’était compliqué parce qu’elles appartenaient aux banques, à la gouvernance compliquée. Leur groupement d'intérêt économique (GIE) retrace les transactions bancaires. 

Éco-mots

Groupement d'intérêt économique (GIE)

Structure intermédiaire entre la société et l’association, qui permet à plusieurs entreprises de se réunir pour développer leurs activités, améliorer leurs résultats, tout en restant indépendantes. 

Le jour du confinement, ils ont finalement accepté de collaborer avec nous. Ce sont des opportunités qu’offrent la crise ! Je leur ai dit qu’elles étaient nécessaires pour prendre l’ampleur du choc. Le GIE a décidé ça quasiment instantanément. D’un seul coup, ce qui était difficile, renvoyé au service juridique, est devenu possible. Quelqu’un a dit : « On file ces données à l’Insee, c’est capital ». Depuis, ce partenariat se poursuit de manière très fluide. 

Est-ce directement vous qui négociez avec le président du GIE l’accès aux données de cartes bleues ? 

Les négociations duraient depuis plusieurs années. L’élément bloquant était technique :  comment on pouvait utiliser les données. De fait, dans la crise, oui, ça s’est passé à mon niveau avec le président du GIE lui-même. Les données qu’ils ont restent la propriété des banques. 

Ce qu’on fait techniquement dépend des cas : pour les données de caisse, nous importons les données dans nos systèmes d’information. C’est du cloud. Il y en a énormément. On les traite nous-mêmes. Dans le cas des cartes bleues, l’Insee a transmis ses besoins au GIE. Ils gèrent en interne les traitements informatiques et nous livrent les données synthétiques prêtes à l’emploi. 

Pour la téléphonie mobile, on a cherché à savoir où étaient les Français pendant le confinement. En fonction de l’endroit où les portables bippaient, on savait comment la population se répartissait sur le territoire. Orange disposait déjà de ces données. Idem, l’idée était de créer un partenariat, mais c’était laborieux. Et là, même prise de conscience : pendant la crise, le comité exécutif d’Orange a décidé de nous transmettre gratuitement ce dont nous avions besoin, pour une durée de trois mois. 

Avec Orange, on a du mal à se comprendre. 
Jean-Luc Tavernier, 

directeur général de l'Insee.

Le groupement de cartes bleues continue à nous fournir ces informations gratuitement. Hélas, Orange veut désormais nous faire payer. Moi, je ne veux pas. Nous sommes dans l’impasse. 

Vous réalisez une économie sur le nombre d’enquêteurs envoyés sur le terrain. Les entreprises y voient une manne financière à tirer...

Ça dépend un peu de leur culture. Il est vrai qu’Orange a la culture d’utiliser les données à des fins commerciales. Ils ont des contrats avec les collectivités locales, pour qu’elles sachent combien de personnes se déplacent au stade, par exemple, d’où elles viennent, etc. Pour Orange, cette activité peut être pourvoyeuse de cash. Pour les cartes bleues, non, les banques n’ont pas du tout cette culture-là. 

Pour ces raisons, il est plus compliqué de discuter avec un partenaire comme Orange. Notre réponse systématique, c’est aussi celle de nos homologues européens, est la suivante : nous sommes prêts à indemniser les coûts engendrés pour le formatage des données aux standards de l’Insee. Mais pour des données dont l’entreprise dispose déjà, on ne les laisse pas faire de profits dessus. C’est pour ça qu’avec Orange, on a du mal à se comprendre.