Deuxième partie : le projet « République numérique » propose quelques autres innovations au titre de l’utilisation des données publiques ou assimilées, et consacre son 2e volet à la protection de l’identité numérique des personnes.
(cf. première partie)
Elargissement des données privées accessibles à la statistique publique
L’INSEE, qui va perdre la faculté de commercialiser ses données, pourra en revanche bénéficier d’un accès direct aux bases de données des entreprises privées aux fins d’enquêtes statistiques. L’accès ne sera toutefois pas automatique, et on ignore quels types de données seront « collectables » selon ce nouveau dispositif – qui posera également la question de l’interopérabilité des formats.
Le gouvernement donne l’exemple des données de caisse de la grande distribution, mais l’exemple est transposable à l’infini et pourrait tout aussi bien revêtir une dimension big data s’il s’agit de capter les données comportementales quotidiennement collectées par les sites marchands sur internet…
C’est une chose que de poser le principe d’un accès automatisé aux données des entreprises pour renforcer le travail statistique de l’INSEE, c’en est une autre que d’affronter le secret d’affaires et les réticences que certaines entreprises privées auront à libérer leurs propres données par ce biais. Le texte prévoit donc qu’une analyse d’opportunité et de faisabilité pourra précéder une telle communication, et qu’une sanction pourra suivre tout refus de l’entreprise enquêtée…
En outre, comme les données publiques issues des administrations et des services publics vont aussi bénéficier aux entreprises (de toutes tailles) qui enrichiront leurs offres, créeront de nouveaux services et proposeront de nouvelles pratiques, il serait très opportun de vérifier que celles qui auront accès à ce gisement informationnel (c’est-à-dire a priori toutes) sont elles-mêmes en conformité avec leurs obligations, notamment fiscales, en France.
Il va sans dire que si une entreprise bénéficie des valeurs créées par l’impôt pour enrichir ses offres, la moindre des choses est qu’elle se soit acquittée de l’ensemble de ses obligations à ce titre. Cela pose donc la question de ce que les entreprises américaines telles que Google ou Amazon feront de ces gisements informationnels, alors qu’il est de notoriété publique que ces entreprises ne s’acquittent pas des obligations fiscales liées à leurs activités en France ni même en Europe…
Toutefois, il semble difficile d’aménager à la fois un principe de diffusion inconditionnel des données libérées en Open Data, d’une part, et de réapposer des conditions spécifiques et supplémentaires à certaines entreprises d’autre part. Mais il apparaît également très souhaitable d’exiger des entreprises étrangères qui pourraient profiter de l’ouverture des bases publiques, que ces entreprises respectent en effet leurs obligations fiscales, ainsi qu’une certaine transparence dans leurs activités et le respect strict des droits des personnes (vie privée notamment). Ou alors, le déséquilibre des forces qu’on constate entre entreprises européennes et américaines dans l’exploitation du big data, risque de se reproduire dans l’exploitation des données publiques placées en Open Data…
Evocation d’un « domaine commun informationnel »
On trouve à l’article 8 du projet une innovation juridique majeure, attendue depuis des années : la notion de « Communs », et plus précisément de « biens communs informationnels ».
La notion de Communs n’est pas inédite en droit français (cf. les res communis de l’article 714 du Code civil), mais était largement tombée en désuétude, derrière la protection classique du domaine public, d’une part, et tous les monopoles d’exploitation privés d’autre part. Or, cette notion a été considérablement revivifiée avec internet et le changement de paradigme induit par le déploiement du réseau et la montée en puissance de l’information comme valeur.
C’est à notre connaissance la première affirmation positive moderne de l’existence de « biens communs » relevant d’un « domaine commun informationnel », donc insusceptibles de protection ou de réservation privative (dénoncé par les tenants des Communs comme le « copyfraud »). Cette innovation traduit un changement plus profond : pendant les 2 derniers siècles, la propriété privée s’est essentiellement définie en réaction au pouvoir étatique et donc également au domaine public… et l’on se dirige à présent vers un rééquilibrage en faisant échappant certains éléments de base à toute forme de réappropriation privative – ceci dans l’intérêt général, et pour ne pas brimer l’innovation ou la réserver à quelques « détenteurs » de droits privatifs seulement.
Le projet de loi dispose donc que relèvent du « domaine informationnel commun » :
- les informations, faits, idées, principes, méthodes et découvertes, c’est-à-dire le fruit d’activités intellectuelles humaines, lorsqu’ils sont publiquement divulgués de manière licite (sans violation de la vie privée, du secret d’affaires ou d’un droit de propriété quelconque, ce qui limite sérieusement la portée du principe),
- les œuvres, dessins, modèles, inventions, bases de données protégeables mais dont la protection est parvenue à expiration (c’est-à-dire toute création ou invention qui était jusqu’ici élevée dans le domaine public), et
- les données diffusables dans le cadre de la loi CADA.
Le projet renvoie expressément à l’article 714 du Code civil et établit une équivalence entre les biens communs informationnels et les res communis dont cet article dispose, dans un style aussi réjouissant que suranné, qu’« il est des choses qui n’appartiennent à personne et dont l’usage est commun à tous. Des lois de police règlent la manière d’en jouir ».
Hormis le droit moral qui ne se prescrit ni ne se perd, ces « biens communs informationnels » doivent donc rester à la libre disposition de tous, et c’est bien la moindre des choses lorsqu’on rappelle régulièrement que « les idées sont de libre parcours », que les « méthodes ne se protègent pas » ou qu’au-delà d’un monopole personnel temporaire, la société recouvre la pleine jouissance collective des créations intellectuelles et des inventions, puisqu’on ne crée jamais ex nihilo et que toute invention procède d’un contexte technique, historique et scientifique préexistant auquel elle doit retourner in fine.
L’affirmation est de taille, et on pressent d’ores et déjà les frictions qui se produiront entre les démarches de « copyfraud » ou la protection de certains investissements, d’une part, et cette protection nouvellement énoncée des biens communs d’autre part. Le risque d’incohérence est d’autant plus fort que le projet de loi Valter, sur la « gratuité de la réutilisation des données publiques », laisse la porte ouverte aux pratiques de copyfraud.
D’aucuns regrettent cependant un texte moins audacieux que ses premières versions, qui autorisaient également les auteurs et inventeurs à mettre leurs créations et inventions dans ce domaine informationnel commun de manière volontaire, ce qui aurait fourni une règle générale compatible avec les très nombreuses figures actuelles que sont les licences libres ou les licences creative communs.
Et force est de constater qu’en l’état de sa rédaction, le projet distingue mal entre domaine informationnel commun, et domaine public classique. L’article semble plutôt tracer une ligne Maginot entre les propriétés intellectuelles usuelles, et le domaine public appliqué aux biens incorporels, que consacrer réellement la propagation de ces formules innovantes.
Plus problématique encore, l’article conserve une définition du domaine commun par contraste avec ce qui n’est pas déjà approprié d’une façon ou d’une autre. Les licences libres, choisies individuellement par les auteurs, ont donc encore de l’avenir. Mais surtout, il ne vient en réalité retrancher aucune donnée, aucun élément « de base » du périmètre de ce qui reste appropriable à titre privatif. D’aucuns parlent donc d’une reconnaissance en trompe-l’œil d’un domaine public informationnel qui sera toujours conditionné par l’absence d’un droit privatif.
Mais le projet reconnaît à des associations agréées la faculté de défendre ces biens qui, justement, n’appartiennent à personne, puisqu’ils appartiennent à tout le monde. On devrait donc voir fleurir des actions contre nombre de « conditions générales » qui réapposent des droits de propriété intellectuelle fictifs sur des éléments du domaine public, mais au-delà, la réflexion sur ce que doivent être les « biens communs » dans un contexte dématérialisé et mondial, semble devoir rester conditionnée par les conceptions plus traditionnelles des propriétés intellectuelles.
Toutefois, si le domaine commun informationnel bénéficie réellement à chacun, on regrette que chacun, personne morale ou physique, ne puisse pas agir directement et sans agrément préalable pour faire respecter l’interdiction d’appropriation énoncée dans l’article.
Il est donc très important de suivre ce que sera cet article dans la mouture finale de la loi.
Ouverture des publications de la recherche scientifique publique
Dès lors que les deniers publics auront financé au moins la moitié de travaux de recherche scientifique, les publications en résultant pourront être mises en ligne gratuitement par leurs auteurs, nonobstant toute cession exclusive à un éditeur, au terme d’un délai de 12 mois pour les sciences « dures » telles que médecine, sciences et techniques, et de 24 mois pour les sciences humaines et sociales.
L’article raccourcit donc en réalité la durée du monopole d’exploitation qu’un éditeur peut obtenir de la part du chercheur, afin de favoriser la libre circulation du savoir qui réside, par définition, dans ces écrits. Toutefois, tous les scientifiques ne partagent pas forcément cette approche et estiment qu’elle peut créer un risque de paralysie des contenus pendant la période de 12 mois instituée, alors qu’il était possible de publier plus tôt tant que la loi n’en disait encore rien…
Recherche et statistiques utilisant le numéro de sécurité sociale
Le fameux NIR est à l’origine de plusieurs législations capitales liées aux données, à commencer par la loi du 6 janvier 1978 dite « Informatique & Libertés », qui avait éclos après le projet « SAFARI » au sein duquel le gouvernement de l’époque se proposait d’interconnecter les fichiers de ses différents services via le NIR.
Les débats et le fameux rapport Tricot qui les avait suivi étaient exemplaires des principes qu’il convient de mettre en balance lorsqu’on légifère sur la faculté pour l’administration de mettre la population en chiffres, en base et en équations. Ces principes, qu’on perd parfois de vue tant les innovations techniques et économiques sont rapides, conservent pourtant toute leur pertinence, face à une société en voie de « panoptisation », et face aux dérives de la surveillance globale en tout état de cause.
Pour autant, dans le cadre de la numérisation des institutions, le NIR va pouvoir être utilisé pour croiser des données et des fichiers distincts, à des fins de statistiques et de recherche publique uniquement, à condition d’être chiffré au préalable et de manière irréversible. Les croisements seront ensuite soumis à un régime de déclaration ou d’autorisation de la CNIL.
Le gouvernement entend ainsi faciliter les travaux de statistique publique et de recherches en sciences sociales, tout en « maintenant un haut niveau de protection des données personnelles ». Outre le fait que l’état de nombreux fichiers publics (STIC, FNAEG…) et privés (scoring, non-respect du consentement de la personne, transferts non autorisés…) permet de s’interroger légitimement sur le « haut niveau de protection » que confère une simple déclaration CNIL, on entérine néanmoins ici la possibilité de croisements qui avaient défrayé la chronique il y a trente ans.
Tout dépendra donc de la véritable anonymisation, irréversible, qui pourra être mise en place sur le NIR, et du contrôle des utilisations qui seront faites des données ainsi rapprochées. Ces contrôles seront-ils ouverts à tout un chacun, ou réservés à la seule CNIL ?
(à suivre)