Big data, qui êtes-vous ?

La donnée est aujourd’hui le carburant de l’innovation (« the fuel for innovation« ) disait Neelie Kroes, Vice-présidente de la Commission européenne en charge de l’Agenda numérique le 7 novembre 2013.

Selon la Commission européenne, reprise par la Fonderie Agence numérique, chaque minute, le volume de données produit dans le monde est équivalent à 360 000 DVD standards. Cette « montagne » de données est ce que l’on nomme « big data ». Cette notion recouvre en réalité une capacité à collecter massivement et automatiquement des données de toute nature pour ensuite les analyser. Le groupe de l’article 29 définit d’ailleurs les « big data » comme « des ensembles gigantesques de données numériques détenus par des entreprises, des gouvernements et d’autres grandes organisations » en vue de les analyser grâce à des algorithmes. C’est sans doute la raison pour laquelle les caractéristiques du « big data » sont identifiées suivant la règle des 3V (Volume, Variété et Vélocité) dont la définition est attribuée au cabinet Gartner. Volume d’abord parce que la volumétrie des données traitées est importante voire gigantesque. Variété ensuite parce que les données en question sont de nature diverse. Vélocité enfin parce que les données sont traitées rapidement voire quasiment en temps réel.

Quelle compatibilité avec les principes de la loi Informatique et Libertés ?

Dès lors que l’on parle de données, une attention particulière est portée sur la manière dont les données des personnes physiques sont utilisées au regard de la réglementation sur la protection des données à caractère personnel. Or, si les ensembles de données contiennent des données personnelles, ils comportent aussi des données relatives à des personnes morales qui échappent à ce cadre juridique. Par conséquent, il est important de garder à l’esprit que la notion de « big data » ne se confond pas avec la notion de « donnée personnelle » au sens de l’article 2 de la loi du 6 janvier 1978 modifiée en 2004. En revanche, ces deux notions interagissent lorsque les données en cause sont relatives à des individus.

Les données massives questionnent le cadre juridique de la protection des données. Par exemple, les principes de finalité et de pertinence des données postulent que la finalité soit déterminée préalablement à la collecte afin que les données collectées soient adéquates. Cela permet de définir un cadre au-delà duquel le responsable de traitement ne pourra pas collecter de données car non nécessaires à la réalisation de la finalité. Par ailleurs, ce principe empêche la réutilisation des données pour une finalité non définie au moment où elles ont été collectées. En outre, les droits des personnes semblent peu respectés. Les collectes interviennent à l’insu des personnes qui ne bénéficient pas de l’information requise et leur consentement n’est pas toujours sollicité.

Quels impacts pour les personnes physiques ?

Le groupe de l’article 29 reconnaît que l’analyse de ces données massives pourrait permettre l’identification de tendances générales d’un marché économique déterminé. En revanche, il dresse un constat alarmant des conséquences que pourraient produire l’analyse de ces données massives pour les personnes physiques. Ainsi, des analyses prédictives pourraient permettre aux opérateurs d’anticiper le comportement des consommateurs pour leur proposer une offre de biens et services « sur mesure ». Ces analyses ont fait parler d’elles récemment lorsque les médias révélaient que la société Amazon avait inventé un système de livraison anticipée pour lequel un brevet a été déposé. La Cnil identifie de possibles discriminations générées par l’automaticité de la décision rendue à l’égard des personnes (domaine de l’assurance par exemple).

Il n’en demeure pas moins que les « big data » peuvent impulser l’économie des États grâce aux investissements nécessaires au stockage et à l’exploitation des données. C’est ce qui faisait dire à Neelie Kroes, le 7 novembre 2013, que les « big data peuvent être davantage qu’un slogan à la mode. Ils peuvent être la recette pour une Europe compétitive ». En France, les « big data » comptaient parmi les trente-quatre priorités de la réforme souhaitée par le ministre du redressement productif du gouvernement Ayrault pour les petites et moyennes entreprises (La nouvelle France industrielle, rapport présenté en septembre 2013 par M. le Ministre Arnaud Montebourg). Sept projets « big data » avaient été déclarés éligibles à un financement de 11,5 millions d’euros.

Reste à savoir si les promesses, notamment en termes d’emplois créés, seront au rendez-vous et comment ce phénomène s’inscrira dans le paysage européen au regard de l’évolution à l’étude sur la protection des données.