La réutilisation de données publiques à des fins de recherche
Contexte
Dans le cadre de « l’affaire Benalla », une ONG belge œuvrant dans la lutte contre la désinformation réalise une étude visant à identifier l’origine politique des « Tweets » échangés sur le sujet. Dans ce but, un chercheur bénévole de l’ONG collecte et analyse les données publiques provenant de plus de 55’000 comptes Twitter, dont 3’300 sont classés en fonction des affinités politiques. En réponse à des critiques sur la méthodologie de l’étude, le chercheur publie les données brutes de l’étude contenant des données personnelles de nombreux individus.
À la suite de plaintes (plus de 240), l’Autorité belge de protection des données (APB) ouvre une enquête et condamne aussi bien l’ONG que le chercheur à des amendes de EUR 2’700, respectivement EUR 1’200 pour diverses violations du RGPD.
La décision de l’APB a été rendue après consultation et approbation de la CNIL dans le cadre du mécanisme de coopération instauré par l’art. 60 RGPD. Il peut ainsi être considéré que son contenu correspond également à la position de l’autorité de surveillance française.
La réutilisation de données personnelles à des fins de recherche (non médicale) est licite à condition d’être encadrée par des mesures appropriées. À défaut, les personnes et organisations responsables du traitement peuvent être sanctionnées. Nous analyserons ci-après les principaux enseignements à tirer de cette décision :
Une organisation et son chercheur peuvent être responsables conjoints du traitement
En principe, les chercheurs qui sont employés par une organisation n’agissent ni comme responsables du traitement, ni comme sous-traitants de celle-ci, mais effectuent en quelque sorte les traitements au nom et pour le compte de l’organisation.
Dans la présente affaire, l’ONG et le chercheur se sont mutuellement rejeté la responsabilité des divers traitements effectués dans le cadre de l’étude. L’APB retient que tous les deux sont conjointement responsables du traitement :
- L’ONG en sa qualité de commanditaire et éditeur de l’étude, qui a publié l’étude sous son nom et sur son site. Au demeurant, deux administrateurs de l’ONG avaient relu et corrigé l’étude avant sa publication.
- Le chercheur en tant que contributeur bénévole de l’ONG, dans la mesure où il a volontairement rédigé l’étude et a déterminé en partie les moyens de traitement des données.
Cette conclusion s’inscrit dans la lignée de précédentes décisions concernant cette thématique, qui retiennent de manière toujours plus large une responsabilité conjointe dans le traitement des données. L’on pense ici notamment à l’arrêt témoins de Jéhovah de la Cour de justice de l’Union européenne (CJUE, affaire C‑25/17 du 10 juillet 2018), qui avait reconnu à la communauté religieuse et à ses membres prédicateurs la qualité de responsables conjoints du traitement. L’art. 5 let. j nLPD ayant repris la terminologie du RGPD, il est probable que les tribunaux suisses s’alignent à l’avenir sur ces décisions.
En conséquence, il est important pour les organisations et les personnes œuvrant dans le domaine de la recherche au sens large – et pas uniquement médicale – d’analyser attentivement leur(s) rôle(s) respectif(s), afin de déterminer leurs responsabilités propres.
Des données personnelles publiquement disponibles sur les réseaux sociaux ne peuvent pas être librement réutilisées
Le caractère public des données personnelles disponibles sur les réseaux sociaux ne leur fait pas perdre la protection conférée par le RGPD. Ainsi, sauf à bénéficier d’exceptions, les responsables du traitement ne sont pas exemptés du respect de leurs obligations (nécessité de disposer d’un motif justificatif, obligation d’informer, etc.).
À noter que le droit suisse est plus libéral sur ce point, puisqu’il instaure une présomption légale (mais pas une fiction) d’absence d’atteinte à la personnalité lorsque la personne concernée a rendu les informations accessibles à tout un chacun (art. 12 al. 3 LPD, art. 30 al. 3 nLPD). Ceci ne libère en principe pas de l’obligation d’informer les personnes concernées par un éventuel traitement, obligation dont la portée en droit suisse se généralisera lors de l’entrée en vigueur de la LPD révisée (art. 19 nLPD).
Obligation d’informer les personnes concernées
L’obligation d’informer les personnes concernées représente en pratique un obstacle important à la conduite de nombreuses activités qui nécessitent la réutilisation de données publiquement disponibles. Les exceptions prévues, notamment le fait que la fourniture des informations se révèle impossible ou exigerait des efforts disproportionnés, sont interprétées restrictivement par les autorités européennes.
La nouvelle LPD reprendra sur ce point les mêmes exceptions que le RGPD, mais il reste à voir si les autorités suisses appliqueront ces exceptions de manière plus libérale, ce qui serait souhaitable. Rappelons à cet égard que le manquement intentionnel aux obligations d’informer sera pénalement sanctionné (art 60 al. 1 let. b ch. 1 nLPD).
L’exception de recherche scientifique peut s’appliquer même en l’absence de disposition topique dans le droit national.
L’art. 89 par. 2 RGPD autorise les États membres à adopter des dérogations lorsque des données sont traitées à des fins de recherche scientifique ou historique. L’art. 85 RGPD prévoit une règle similaire pour les traitements à des fins journalistiques. Dans le cas présent, l’APB a appliqué ces règles même en l’absence de dispositions d’application dans la législation belge (qui n’avaient pas encore été implémentées au moment des faits).
Ceci est particulièrement intéressant pour les organisations suisses qui sont soumises au RGPD sur la base de l’art. 3 par. 2 RGPD (critère du ciblage ou du monitoring). Dans ces cas, il est souvent difficile de déterminer si le droit d’un État membre peut s’appliquer pour légitimer certains traitements. La présente décision ouvre à notre avis la porte à une application de ces exceptions même en l’absence de rattachement au droit national d’un État membre.
Le consentement des personnes concernées n’est en principe pas nécessaire
Le recours à l’exception de recherche peut soustraire les responsables de traitement à l’obligation d’information préalable, mais ne les décharge pas des autres obligations du RGPD, comme l’obligation de disposer d’un motif justificatif adéquat pour le traitement de données envisagé.
Dans le cas présent, l’APB a considéré que la collecte massive des données et leur traitement en vue d’effectuer la recherche visée (notamment le profilage des opinions politiques) pouvaient reposer sur l’intérêt légitime du responsable de traitement. En conséquence, ces traitements ne nécessitaient pas l’obtention du consentement des personnes concernées.
Quoique reposant sur un raisonnement différent, nous sommes d’avis que la solution serait identique en droit suisse au vu notamment de l’art. 13 al. 2 let. e LPD (respectivement l’art. 31 al. 2 let. e nLPD).
Importance des mesures techniques et organisationnelles
Afin de pouvoir bénéficier de l’exception de recherche, des garanties de nature technique et organisationnelle doivent être mises en place pour assurer les droits des personnes concernées.
C’est bien l’absence de telles mesures qui justifie dans le cas présent le prononcé de sanctions en lien avec la réalisation de l’étude (la publication des données brutes constituant un second motif de sanction).
Dans la mesure où l’ONG traitait les données — publiques ou non — à des fins de profilage politique, et donc, in fine, traitait des données sensibles, de telles garanties devaient selon l’autorité comprendre une documentation interne (registre de traitement, analyse d’impact préalable) et externe (politique de confidentialité) concernant la méthodologie de traitement des données et leur degré d’anonymisation/pseudonymisation.
Les manquements constatés dans cette affaire permettent d’illustrer une série de mesures minimales que les organisations devraient implémenter en lien avec des projets de recherche :
- Registre des traitements : l’absence de registre des activités de traitement est souvent le premier manquement constaté par les autorités de protection des données européennes. Chaque organisation devrait donc se doter d’un tel registre, ce d’autant plus que la LPD révisée instaurera une obligation similaire (12 nLPD).
- DPIA : une analyse d’impact relative à la protection des données (DPIA) doit être réalisée en cas de risque élevé pour les droits des personnes concernées. Dans le cas analysé, l’autorité a considéré que tel était le cas, même si les données de base étaient publiques.
- Pseudonymisation : la pseudonymisation et l’anonymisation constituent des mesures de sécurité cardinales dans le domaine de la recherche. Tant le RGPD (89) que la LPD révisée (art. 31 al. 2 let. c ch. 1) imposent explicitement des exigences dans ce contexte. En l’occurrence, l’ONG a manqué à ses obligations de sécurité en ne pseudonymisant pas les données collectées.
- Politique de confidentialité : selon l’autorité, l’ONG aurait dû publier une politique de confidentialité informant les personnes concernées sur la manière dont leurs données étaient traitées. Si l’on peut douter de l’efficacité d’une telle mesure dans le cas présent (collecte indirecte des données sans information préalable), les organisations seront bien inspirées de mettre en place une telle mesure afin de limiter leurs risques.
Enfin, toujours veiller au principe de proportionnalité
L’autorité a considéré que la collecte massive de données sur Twitter et le profilage politique d’utilisateurs étaient proportionnés, compte tenu notamment de l’importance de la finalité de recherche et l’intérêt journalistique en jeu.
En revanche, la publication des données brutes (contenant des données identifiantes) par le chercheur à la suite de la contestation de l’intégrité de l’étude, sans prise de précautions minimales de sécurité (p. ex. la pseudonymisation des données ou la restriction de l’accès aux données), a été qualifiée d’atteinte disproportionnée aux droits des personnes concernées.
Il importe donc de toujours veiller au respect du principe de proportionnalité, même lorsque l’on traite des données qui sont publiquement disponibles et pour des finalités de nature « idéale ».
Proposition de citation : Alexandre Jotterand, La réutilisation de données publiques à des fins de recherche, 24 mars 2022 in www.swissprivacy.law/132
Les articles de swissprivacy.law sont publiés sous licence creative commons CC BY 4.0.