samedi 12 décembre 2015

Projet de loi pour une République numérique : un bon thriller pour les chercheurs

[Mise à jour du 12 décembre : ajout d'une note 1 en fin d'article sur le régime de libre réutilisation des données de la recherche, ou comment un régime de réutilisation similaire à celui des licences Creative Commons fait son entrée dans la loi]

[Article remanié/corrigé le 11 décembre à 11h15, principalement pour ce qui touche aux données de la recherche]


Depuis quelques jours, plusieurs nouveaux épisodes sont venus enrichir la saga du projet de loi Lemaire. La semaine dernière, le gouvernement répondait aux contributions qui n'ont pas été retenues dans le cadre de la consultation numérique. Mercredi 9 décembre, de nouveaux rebondissements ont émaillé la série : le gouvernement a rendu public un avis extrêmement critique du Conseil d'Etat sur le texte, tandis que le gouvernement a soumis à l'Assemblée Nationale la version définitive du projet de loi, qui sera débattu par les parlementaires en procédure accélérée.
Le même jour, la commission européenne a dévoilé sa "vision" pour moderniser les règles du droit d'auteur dans le cadre de la révision de la directive "Infosoc". Or parmi les propositions formulées, issues pour partie du rapport de la députée Julia Reda, figure l'exception de Text and Data Mining, tant réclamée par les chercheurs.
Tous ces ingrédients réunis permettent de concocter un bon thriller...


Text and Data Mining : l'invité-fantôme qui est là sans être là


Par Bonnybbx. CC0. Source : Pixabay

On peut se demander pourquoi l'exception de fouille de données, présente dans l'une des versions de l'avant-projet qui avait "fuité" cet été, ne figure toujours pas dans la dernière version du projet de loi. Des éléments de réponses sont à trouver dans les motivations apportées par le gouvernement au rejet de certaines propositions lors de la consultation. En fait, la réponse est toujours la même (voyez ici, , ou encore ) :

Il y a aujourd’hui un consensus pour reconnaître que le text and data mining (TDM) représente un enjeu majeur d’innovation, mais aussi de positionnement concurrentiel pour la recherche, notamment vis-à-vis de pays comme le Royaume-Uni. La voie contractuelle, qui nécessiterait une négociation éditeur par éditeur, s’est montrée inadaptée à ce jour pour permettre l’application des techniques de TDM à de grands ensembles de corpus, à des fins de recherche.

La voie législative, qui introduirait une nouvelle exception au droit d’auteur, supposerait pour sa part de mettre en place des garanties permettant de répondre aux inquiétudes des éditeurs, en particulier face au risque de dissémination des copies numériques. Cette garantie pourrait être offerte par l’intermédiation d’un tiers de confiance. A cet égard, il est à noter que la Bibliothèque nationale de France (BnF) s’est d’ores et déjà portée candidate pour jouer un tel rôle.
La concertation entre le ministère de l’éducation nationale de l’enseignement supérieur et de la recherche et le ministère de la culture et de la communication se poursuit sur ces questions, dans le contexte de la révision en cours de la directive européenne sur le droit d’auteur.
Le gouvernement ne ferme pas totalement la porte à la possibilité d'une telle exception, mais il ne veut pas perturber les discussions en cours au niveau de l'Union Européenne sur l'exception de TDM. Contrairement au Royaume-Uni, il fait dépendre sa consécration par la loi et sa mise en oeuvre, de l'adoption préalable par le Conseil de l'UE, de la prochaine directive sur le droit d'auteur.

Mais l'UE est-elle vraiment déterminée à consacrer une exception de Text and Data Mining ? On peut, à l'instar de la League of European Research Universities (LERU), en douter :

[The Commmunication] says that the Commission is assessing options and will consider legislative proposals. The Commission has had years to consider options and proposals. It is time to stop considering and to start implementing. The time for action is now. LERU is disappointed that the legislative programme is not addressed in a more convincing and coherent way.


Droit d'exploitation secondaire : le Conseil d'Etat est son ennemi...


Zombie attack

Le texte soumis pour avis au Conseil d'Etat prévoyait un "droit d'exploitation secondaire" ("Zweitverwertungsrecht" dans la loi allemande de janvier 2014 dont s'inspire très fortement le texte) au profit des auteurs, les autorisant à mettre à disposition gratuite leurs articles dans la version éditeur finale du manuscrit acceptée pour publication, passé un délai de 6 mois pour les Sciences, Techniques, Médecine (STM), et 12 mois en Sciences Humaines et Sociales (SHS).
Mais dans l'avis du 3 décembre, rendu public par le gouvernement le 9, le Conseil d'Etat expédie sauvagement cette possibilité au nom du principe de la territorialité des lois :
En ce qui concerne la mise à disposition gratuite sur l’internet des résultats de recherches financées sur fonds publics, prévue par l’article 14, le Conseil d’Etat a relevé que l’impact d’une telle mesure sur les contrats futurs entre éditeurs et auteurs tenait à son caractère d’ordre public, lequel ne peut jouer que sur le territoire français, alors que l’effet de la diffusion sur l’internet est mondial. Cette incohérence lui a paru faire obstacle à l’adoption de cette mesure.
Le raisonnement paraît curieux; le Conseil d'Etat estime que, puisque la diffusion des articles via Internet atteint potentiellement une audience mondiale, il ne devrait pas être possible de légiférer (nationalement) sur le statut des articles de recherche. Est-ce à dire que les lois votées récemment par l'Allemagne, l'Italie, l'Espagne ou bien l'Argentine ou les Etats-Unis devraient être invalidées ?

Heureusement, dans un twist digne des meilleures intrigues, le gouvernement n'a pas suivi l'avis du Conseil d'Etat, de sorte que l'actuel article 17 maintient la possibilité d'une diffusion en accès libre des travaux scientifiques financés sur fonds publics (au moins 50 %), au terme d'une durée d'embargo inchangée : 6 mois en STM, 12 mois en SHS.

L'étude d'impact de la loi prévoit en outre un plan d'accompagnement des revues en SHS à la transition vers le libre accès, qui pourrait être mis en oeuvre dès 2016. "Le plan, ciblé sur les revues de recherche de haut niveau, s'adresse aux revues françaises, voire francophones, sélectionnées sur une base scientifique". Deux options seront offertes : "passage à une barrière mobile ramenée à 12 mois, ou libre accès immédiat, options qui peuvent être panachées en fonction du choix des revues".


Données de la recherche : elles sont entrées par la grande porte, leurs ennemis les feront peut-être sortir par la fenêtre...



Crasch

Dans la précédente version du texte, les données de la recherche étaient qualifiées de "choses communes" au sens de l'article 714 du Code Civil :
Il est des choses qui n'appartiennent à personne et dont l'usage est commun à tous.
Des lois de police règlent la manière d'en jouir.
Cette qualification avait pour mérite de faire resurgir au détour d'un article, la notion de commun de la connaissance, et ce, en dépit de la disparition de l'ex-aticle 8 qui consacrait plus globalement un "domaine commun informationnel". Le concept de "choses communes" permettait également d'ancrer la notion de commun dans un temps long, qui trouve ses origines dans le droit romain.

Le Conseil d'Etat a rejeté la qualification de "choses communes" en l'absence d'une véritable étude d'impact :

En outre, le Conseil d’Etat n’a pu retenir cette disposition ainsi que celle qui qualifie de « choses communes » au sens de l’article 714 du code civil les données issues de recherches financées sur fonds publics et qui permet la libre réutilisation de ces données une fois publiées, au motif qu’il n’a pas disposé d’une véritable étude des impacts positifs ou négatifs, juridiques aussi bien qu’économiques qu’on peut en attendre.

Avant la publication de l'avis du Conseil d'Etat, d'autres critiques sur la notion de "choses communes" avaient été émergé ici ou là. Du point de vue du droit, Me Jean Martin, avocat chargé par le Conseil Supérieur de la Propriété Littéraire et Artistique (CSPLA) de produire un rapport sur la notion de domaine commun informationnel, avait soulevé la question de l'articulation entre Code Civil et Code de la Propriété Intellectuelle, sur la base de la définition jurisprudentielle complexe de "lois de police". D'un point de vue philosophique, Dardot et Laval ont démontré que le Commun doit se définir comme la résultante d'une activité commune de co-construction et non comme une chose en soi, déterminée par nature.

Le gouvernement a donc remanié le texte en évacuant la notion de "choses communes". Après cet énième remaniement du texte, les communs informationnels sortent du dispositif de la loi par la petite porte. Le nouveau texte maintient néanmoins un régime de libre réutilisation pour les données de la recherche:
« II. – Dès lors que les données issues d’une activité de recherche, financée au moins pour moitié par des dotations de l’État, des collectivités territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne, ne sont pas protégées par un droit spécifique, ou une réglementation particulière, et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre.

« III. – L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication.

« IV. – Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite. »
Cependant, en l'état, le régime de libre réutilisation appliqué aux données de la recherche n'est pas totalement garanti. Le texte dit bien : dès lors que les données de la recherche "ne sont pas protégées par un droit spécifique". L'exposé des motifs est encore plus précis : "dès lors que ces données ne sont pas protégées par un droit spécifique, comme par exemple un droit de propriété intellectuelle". Le texte envisage probablement des cas où les données de la recherche sont des images ou des sons sur lesquels les auteurs détiennent des droits de propriété intellectuelle et n'en autorisent pas explicitement la libre réutilisation, s'ils n'ont pas opté pour l'apposition d'une licence Creative Commons.[1]

La formulation n'est pas totalement claire, et laisse la possibilité d'un autre type de conflit : le texte ne fait pas formellement barrage au droit des bases de données. Le producteur d'une base pourrait invoquer le droit sui generis de producteur de base de données, pour revendiquer la captation des données sous-jacentes aux articles déposés dans la base de données.

Le § III a probablement été conçu comme une réponse, un pare-feu. Il prévoit que l'éditeur scientifique ne peut limiter la réutilisation des données de la recherche. Deux types de réserves peuvent être apportés. D'abord, le renvoi au § I laisse à penser que ne sont envisagées que les données "sous-jacentes" à chaque article. Quid des jeux de données déposés de façon autonome sur des plates-formes dédiées mises à disposition par des éditeurs scientifiques ? Dans ce cas de figure, l'éditeur scientifique est-il en mesure de revendiquer son droit de producteur de base de données ? Ensuite, du fait que le § I porte sur les articles pris isolément, il n'est pas certain que le dispositif du § III bloque le déclenchement du mécanisme du droit des bases de données, qui porte sur un corpus de documents mis à disposition sur une plate-forme. La formulation du § III mériterait donc d'être précisée.

On peut espérer que l'article sera remanié prochainement lors des discussions, même limitées (puisque le texte sera voté en procédure accélérée) sur les bancs de l'Assemblée et du Sénat. D'immanquables nouveaux twists sont à prévoir...

[1] Mise à jour du 12 décembre. Je m'aperçois qu'il y a quelque chose d'un peu absurde à dire que les données de la recherche seraient donc libres d'utilisation... sauf si elles ne sont pas. C'est un peu comme si, en cette période d'état d'urgence, on réécrivait l'article 1 de la Déclaration des Droits de l'Homme et du Citoyen de la façon suivante : "Les hommes naissent et demeurent libres et égaux en droits.. dès lors qu'ils ne sont pas emprisonnés ni traités de façon inégale." Ou bien les données de la recherche sont libres de réutilisation et en ce cas, aucun droit de propriété intellectuelle ne peut en limiter la libre réutilisation, ou bien elles sont placées sous un faux régime de libre réutilisation, révocable à merci dès lors que les auteurs y opposent des droits de propriété non assortis d'une autorisation expresse de libre réutilisation.
Il faudrait exactement comprendre ce qu'entendent les rédacteurs par "Dès lors que les données issues d’une activité de recherche (..) ne sont pas protégées par un droit spécifique, ou une réglementation particulière". En dehors des droits de propriété intellectuelle, d'autres droits peuvent être mobilisés.


Ce qu'il faut surtout retenir de la formulation du § II de l'article 17, c'est que les données de la recherche sont désormais placées sous un régime de libre réutilisation. Cela signifie qu'il ne sera pas nécessaire de demander une autorisation expresse pour réutiliser les jeux de données. A y bien réfléchir, Cela revient à placer les données de la recherche sous un régime de réutilisation semblable à celui qui sous-tend les Creative Commons.

Précisons que ce régime ne dispensera pas du respect de certains droits réservés, comme par exemple la mention de la paternité ou de la source des données.
In fine, deux des amendements que le collectif SavoirsCom1 avait proposés ont été partiellement repris sous une formulation certes très différente, dans le texte déposé à l'Assemblée :
« Lorsqu’il s’agit de données de la recherche au sens qui en est donné par l’OCDE dans le rapport paru en 2007 et intitulé « Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics », les chercheurs ne peuvent revendiquer de droits de propriété intellectuelle sur les jeux de données, hormis apposer une licence imposant la mention de la paternité et le partage à l’identique. » 
(...) 
« Les chercheurs ne peuvent revendiquer de droits d’auteur sur les jeux de données, hormis apposer une licence imposant la mention de la paternité et le partage à l’identique. »

En proposant ces deux amendements, nous avions à l'esprit la licence CC-BY-SA: Creative Commons, mention de la paternité et partage à l'identique.

Si les données de la recherche sont placées sous un simple régime de libre réutilisation, la condition de partage à l'identique est évacuée. En revanche, la formulation du projet de loi permet d'englober les cas de réutilisation des jeux de données sans mention de la source/paternité. Cela correspond à des licences du type CC0 (Creative Commons Zéro) ou PDDL (Public Domain Dedication and Licence).

Le parallèle avec les licences de type Creative Commons s'arrête là : avec la loi numérique, on passe du terrain du contrat à celui de la loi.