Close
  • Français
  • English

31/12/2015Un écosystème de gestion des données personnelles des clients [par Harald Gjermundrød, Département informatique, Université de Nicosie, Chypre]

Cet article présente un cadre conceptuel visant à soutenir un écosystème de données personnelles des clients qui bénéficierait tant aux consommateurs qu’aux entreprises. Le cadre permet aux consommateurs de suivre leurs données personnelles et d’établir une arborescence de partage. L’arborescence de partage indique l’entreprise ayant collecté les données à l’origine, et leur propagation d’une entreprise à une autre. Par ailleurs, le client se voit proposer des incitations (des applications gratuites, par exemple) en échange de leurs données personnelles mais ils sont en mesure de fixer des limites en termes de durée et d’étendue du partage. Les entreprises y trouvent leur compte puisque les consommateurs seront plus enclins à leur fournir des données exactes, et ces derniers aussi, car ils pourront surveiller l’exactitude des données les concernant. En outre, puisque des réglementations plus strictes en matière de vie privée sont adoptées par les États (comme le règlement général de protection des données du Conseil européen, ou GDPR [3]), le cadre proposé représente une solution technique permettant aux entreprises de se conformer à de telles réglementations et « d’oublier » rapidement toute la piste des données qu’elles ont collectées et partagées.

1. Commerce des données personnelles

Avec la prolifération des technologies numériques et la tendance à la numérisation de tous les types d’enregistrements, les citoyens sont de plus en plus préoccupés par la confidentialité de leurs données à caractère personnel que les organisations enregistrent dans le cadre de leurs opérations quotidiennes. Selon le scénario illustré dans la figure 1, un client enregistre des produits récemment achetés (téléphone portable, ordinateur portable, etc.) sur le site du fabricant (entreprises A et B). Les renseignements tels que l’adresse de courrier électronique, l’adresse du domicile, le numéro de téléphone et l’âge font généralement partie du processus d’enregistrement. Mais le client ne sait pas que ses renseignements personnels sont partagés avec les entreprises partenaires (entreprises C et D) qui vendent ensuite les informations à un tiers (entreprise E). Une fois l’enregistrement achevé, le client reçoit soudain un courriel non sollicité d’une entreprise (entreprise E) qui vend des accessoires pour téléphone portable compatibles avec l’appareil qu’il vient juste d’acheter. Le client doit pouvoir savoir si les données fournies lors de cet enregistrement ont été divulguées ou non (avec ou sans son consentement).

ficnews

Partage et vente des données client

Selon [1], 81 % des consommateurs européens pensent que leurs données ont de la valeur mais, en même temps, un consommateur sur trois fournit de faux renseignements afin de protéger sa vie privée. Étonnamment, 68 % des personnes interrogées échangeraient volontiers leurs données personnelles contre une application gratuite [2]. Les consommateurs se soucient de leur vie privée mais sont prêts à échanger leurs données si la valeur monétaire est appropriée. Les entreprises pourraient saisir cette occasion et créer un écosystème où les données personnelles et autres données des consommateurs seraient collectées, feraient l’objet d’une autorisation d’échange de la part de ceux-ci, puis  seraient distribuées à des tiers. Ainsi, les trois piliers de l’écosystème proposé sont :

  • – la valeur des données pour les entreprises et les consommateurs ;
  • – le suivi et la propagation des données à caractère personnel ;
  • – l’exactitude des renseignements collectés.

Le reste de l’article est découpé comme suit. La section 2 présente l’écosystème de gestion des données personnelles des clients. La section 3 détaille l’approche technique de mise en œuvre de l’écosystème proposé. La section 4 propose une conclusion.

2. Écosystème des données personnelles des clients

2.1 Classification des données

Les données peuvent être classées en différentes catégories selon le classificateur et les buts de la classification. Dans l’écosystème des données personnelles des clients, les données sont classées en trois catégories comme suit :

  1. Données professionnelles du client : il s’agit des données associées à une transaction commerciale avec une entreprise comme les établissements financiers, les compagnies d’assurances, les agences de voyages et les détaillants en ligne, pour ne citer que quelques exemples. Il s’agit également des données à caractère personnel qu’il faut fournir pour enregistrer un produit ou avant de demander un service.
  2. Données étatiques et médicales : il s’agit des données qu’un citoyen doit fournir à l’État en vertu de la loi, comme les données fiscales, les renseignements sur l’emploi, et les renseignements médicaux. Ce type de données, considéré comme privé et confidentiel, est généralement géré par des systèmes étatiques aux politiques strictes de protection juridique.
  3. Autres données : il s’agir des données qu’un citoyen peut mettre sur le Web, y compris les médias sociaux, les blogs, les services de partage de photos, etc. La différence entre ce dernier type et les précédents tient au fait que les citoyens fournissent ce type de données de manière volontaire, car elles sont considérées comme non essentielles à des fins sociétales vitales. Il va sans dire que cela ne restera pas le cas longtemps.

L’écosystème proposé gère seulement les données de la première catégorie, c’est-à-dire les données professionnelles du client. Comme la méfiance est de mise entre les consommateurs et les entreprises (voir [1]), un cadre permettant aux consommateurs de suivre leurs données personnelles atténuerait cette méfiance et favoriserait des échanges sains entre les consommateurs et les entreprises.

2.2 Fonctionnalités orientées consommateurs dans l’écosystème

Comme il a été mentionné précédemment, les clients se préoccupent de leurs données personnelles mais accepteraient de les « vendre/échanger ». La valeur commerciale de leurs données personnelles n’est forcément pas monétaire. L’entreprise peut, par exemple, offrir une extension de garantie en échange de renseignements personnels spécifiques qu’elle aura l’autorisation de partager avec ses entreprises partenaires. Une livraison gratuite, des points échangeables, une remise sur la prochaine commande, une mise à niveau gratuite, etc. font partie des autres formes de « paiement ». Le problème des données numériques est que la reproduction et le partage ne coûtent rien. Ainsi, le client pourra encore être préoccupé par le devenir de ses données après leur vente. Afin d’éliminer ces préoccupations, il doit avoir la possibilité de contrôler et de vérifier la diffusion de leurs données. Il convient donc d’élaborer une solution technique permettant aux entreprises d’exploiter les données achetées tout en rassurant les clients ayant vendu leurs données personnelles.

Du point de vue des clients, l’écosystème devrait comprendre au moins des fonctionnalités permettant au client de faire ce qui suit :

  • – donner son accord sur les données à partager avec d’autres entreprises et limiter le nombre de tiers y ayant accès ;
  • – définir la durée de vie des données, au bout de laquelle les entreprises devront supprimer les données (en référence au droit à l’oubli) ;
  • – interroger les entreprises au sujet des données collectées afin de vérifier l’exactitude et/ou la pertinence de celles-ci ;
  • – établir une « arborescence des traces » afin de déterminer la diffusion de données spécifiques, ainsi que leur source ;
  • – prouver que certaines données précises viennent vraiment d’une entreprise donnée, c’est-à-dire apporter la non-répudiation.

Les deux premières fonctionnalités sont négociées avec l’entreprise au moment de l’échange des données. Plus la diffusion est étendue, et plus la durée de vie est longue, plus la valeur de la contrepartie pour le client doit être élevée. Les trois dernières fonctionnalités permettent aux clients de suivre leurs propres données personnelles. Le client doit être en mesure de demander à une entreprise de lui communiquer les données personnelles qu’elle a conservées à son sujet. Outre les données proprement dites, l’entreprise devrait également indiquer au client leur origine et toute autre entité lui ayant acheté les données. Bien évidemment, il faudra disposer d’une solution technique qui permettra au client de faire toute cela relativement facilement.

2.3 Fonctionnalités commerciales de l’écosystème

À l’ère actuelle du numérique, les entreprises font des publicités orientées et ciblées sur leurs produits et services. Pour ce faire, elles doivent collecter énormément de données et les traiter par des techniques d’exploration de données. Plus les données collectées sont exactes et complètes, plus les résultats sont précis. Or, comme indiqué précédemment, un client sur trois fournit de fausses informations. En outre, les États commencent à accorder aux consommateurs (ou l’envisagent) des droits de protection de la vie privée renforcés, comme le règlement général de protection des données du Conseil européen [3]. Les entreprises doivent donc mettre en œuvre des solutions techniques de collecte des données requises conformes aux règlements étatiques. À cet égard, l’implication des consommateurs conduit à la création d’une relation de synergie. Les entreprises doivent être plus transparentes vis-à-vis des clients en ce qui concerne les données personnelles collectées, et les rémunérer (ou les récompenser) pour leurs données. En échange, elles obtiendront des données plus exactes de la part des clients tout en étant conformes aux futurs règlements relatifs à la confidentialité des données.

Du point de vue de l’entreprise, le cadre utilisé pour acheter et revendre les données personnelles des clients devrait au moins proposer :

  • – une solution technique qui facilite la conformité aux réglementations telles que le « droit à l’oubli » ;
  • – une preuve vérifiable de l’origine des données en cas de litige sur l’exactitude des données personnelles ;
  • – des données client exactes et pertinentes ;
  • – la capacité d’échanger des données avec d’autres entreprises tout en respectant les règlements relatifs à la vie privée ;
  • – l’aptitude à combiner les données client de différentes sources (en se basant sur l’identificateur unique du client) et à extraire des nouvelles informations le concernant.

Un avantage supplémentaire est que les entreprises pourront mieux connaître leurs clients en utilisant un cadre où l’utilisateur choisit comment il veut être récompensé (remise, livraison gratuite, etc.) en échange de ses données personnelles : en effet, la rémunération choisie leur offrira de nouvelles informations sur le client. L’entreprise pourra alors les ajouter aux données de ce client et vendre l’ensemble à une autre société. Cette dernière pourra alors exploiter cela dans une campagne ciblée de promotion d’une journée avec livraison gratuite si la fiche du client indique que c’est la récompense qu’il préfère.

3. Dossier de données client dans l’écosystème

Cette section présente un cadre conceptuel – le cadre des données client – contenant toutes les fonctionnalités décrites ci-dessus. Ce cadre convient à la catégorie données professionnelles du client Pour que le cadre puisse proposer toutes les fonctionnalités listées précédemment, les clients doivent avoir un identificateur unique et pouvoir s’authentifier (prouver qui ils sont). Les « citoyens électroniques » d’aujourd’hui possèdent de nombreuses adresses électroniques, et lorsque les clients accèdent à leurs comptes en ligne, leur nom d’utilisateur est souvent leur adresse électronique. Par conséquent, un utilisateur peut s’authentifier en prouvant qu’il contrôle l’adresse électronique associée au compte. L’utilisation de l’adresse électronique en tant qu’identificateur unique d’un client n’est pas une solution parfaite, car les utilisateurs peuvent créer de faux profils liés à une adresse électronique ou posséder de multiples adresses, etc. Mais c’est une approche généralement assez bonne pour identifier de façon unique les clients du monde entier sans devoir impliquer des nouveaux acteurs.

Le cadre utilise l’adresse électronique unique liée à un client spécifique, en plus des métadonnées avec des références. Un client qui s’inscrit auprès d’une entreprise utilise son adresse électronique, qui lui servira alors d’identificateur unique. Un dossier client est alors créé à partir des renseignements fournis par le client lors de la création de son compte. Ce dossier contiendra au moins : une adresse électronique, la date/l’heure de création, une date d’expiration, l’organisation de la collecte, l’identificateur de ressource unique (URI) qui sert de référence pour ce dossier particulier, les références et la signature. Des informations facultatives, telles que les informations personnelles de ce client et le bon de commande, peuvent aussi être enregistrées. Tout cela représente les métadonnées de ce dossier client et est enregistré au format XML. Il existe deux types de références : la référence arrière et la référence avant. Lorsqu’une organisation (source) s’apprête à partager le dossier avec une autre organisation (cible), l’entreprise source place dans les métadonnées du dossier une référence avant qui pointe vers l’emplacement que l’entreprise cible utilisera pour enregistrer le dossier. De même, l’organisation cible doit ajouter dans les métadonnées du dossier une référence arrière qui pointe vers le dossier de l’entreprise source. Ce processus est répété à chaque partage du dossier. Ainsi, cela crée une arborescence ayant pour nœud racine l’origine des données et pour feuilles les entreprises qui n’ont pas encore revendu le dossier. Chaque dossier contient aussi une référence arrière supplémentaire qui pointe vers l’entreprise qui l’a initialement collecté.

Lorsqu’un dossier (ou plus précisément, une copie exacte de celui-ci) est distribué et traité par plusieurs entités, des garanties vérifiables et incontestées doivent être fournies quant à l’intégrité du dossier. Toute modification du dossier doit être attribuée à l’entité qui l’a effectuée. Des techniques cryptographiques peuvent être utilisées, en particulier en signant numériquement le hachage du dossier client avec la clé privée de l’entreprise. Une entreprise pourrait ainsi modifier un dossier pour y ajouter et/ou modifier des données, puis partager avec d’autres sociétés la nouvelle version plutôt que le dossier original. Pour pouvoir suivre les versions, le nouveau dossier intègre aussi le dossier original (signé par l’entreprise ayant divulgué le dossier). Ainsi, le client pourra récupérer toutes les versions disponibles de son dossier (en parcourant l’arborescence). Les entreprises qui ont reçu le dossier de la même entreprise source doivent posséder le même dossier original, quelles que soient les autres modifications apportées au dossier. La signature des dossiers apporte la non-répudiation, en vertu de laquelle une entreprise ne peut pas nier l’existence de versions du dossier venant d’elle.

Un client doit avoir le droit de parcourir l’arborescence du dossier, de la racine aux branches, alors que les entreprises devraient n’être autorisées à parcourir les branches que vers un seul niveau supérieur ou inférieur. Des applications pourraient être développées pour parcourir l’arborescence du dossier avec les contrôles d’accès spécifiés en place. La suppression de l’arborescence est un moyen technique de mettre en œuvre le droit à l’oubli.

4. Conclusion

Cet article a présenté un écosystème de gestion et de partage des données personnelles des clients, avantageux tant pour les clients que pour les entreprises. Le cadre présenté est intéressant pour les clients, car ils seront rémunérés pour leur autorisation du partage de leurs données personnelles. De plus, les outils à leur disposition leur permettront de suivre totalement le partage de leurs données personnelles. Du point de vue des entreprises, le cadre leur permettra de partager les données personnelles de leurs clients tout en se conformant aux règlements. Par ailleurs, l’exactitude des données collectées serait supérieure, ce qui les rendrait plus utiles.

 

Remerciements

Nous tenons à remercier le consortium BeWiser (financé au titre du 7e programme-cadre de l’UE, subvention n° : 319907) pour nos discussions fructueuses sur les questions de sécurité et de vie privée des clients.

Références

  • [1] Symantec Corporation. « State of privacy report 2015 » (Rapport 2015 sur l’état de la vie privée). https://www.symantec.com/content/en/us/about/presskits/b-state-of-privacy-report-2015.pdf. Consulté le 24 novembre 2015.
  • [2] Symantec Corporation. « Internet security threat report 2015 » (Rapport 2015 sur les menaces de sécurité Internet). http://www.symantec.com/security_response/publications/threatreport.jsp. Consulté le 24 novembre 2015.
  • [3] Parlement européen et Conseil de l’Union européenne. Règlement du Parlement européen et du Conseil relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données (règlement général de protection des données). Rapport technique, Parlement européen et Conseil de l’Union européenne, 2015.