samedi 2 juillet 2016

Loi numérique : une exception de TDM (presque) "à l'Anglaise" ?

Réunis en commission mixte paritaire le mercredi 29 juin, les parlementaires ont rendu leurs arbitrages sur les points de désaccord entre les deux chambres. Le texte sera soumis à un vote ultime le 20 juillet pour l'Assemblée Nationale, et à la mi-septembre pour le Sénat. Il faut rester prudent car le gouvernement a toujours la possibilité d'ajouter des amendements, mais a priori, "ceux-ci seront purement rédactionnels ou de coordination". Le texte issu de la CMP peut donc être considéré comme le texte quasi final.

En matière de recherche et de diffusion des savoirs, deux articles retiennent notre attention :

Article 17 : un droit d'exploitation secondaire "à l'Allemande"


J'en ai déjà abondamment parlé sur ce blog. L'article 17 consacre au profit des chercheurs, un droit d'exploitation secondaire de leurs écrits scientifiques, sur le modèle de la loi allemande votée en 2013. C'est la version de la "chambre haute" qui l'a emporté. Mais à vrai dire, les modifications apportées par les sénateurs au texte des députés étaient relativement limitées. Qu'on en juge par cette comparaison :


Exit, donc, la possibilité pour le ministre en charge de la recherche de prévoir des délais inférieurs applicables à certaines disciplines. Il est vrai qu'un traitement différencié selon les disciplines aurait probablement généré en pratique beaucoup de confusion et d'hésitations, car il est fréquent que les travaux de recherche portent sur des domaines interdisciplinaires.

C'est d'ailleurs la grande faille de cet article (la remarque vaut aussi pour la loi allemande) : quid des publications à cheval entre sciences "dures" et sciences humaines et sociales ? Quid par exemple, des délais de mise à disposition gratuite pour un chercheur en informatique travaillant dans le domaine des sciences de l'information ?

Autre modification dans la version du sénat qui prévaut désormais : le délai dont dispose l'auteur d'une publication scientifique "pour [la] mettre à disposition gratuitement dans un format ouvert, par voie numérique" est fixée par un "maximum", précision utile sans laquelle le texte aurait pu être interprété comme invalidant les contrats d'édition aménageant des délais de mise à disposition inférieurs à 6 et 12 mois.

Autre point positif, moyennant certaines réserves déjà évoquées: les données de la recherche sont "librement réutilisables", le texte des sénateurs n'ayant pas modifié celui des députés sur ce point.



Article 18 bis : une exception de TDM (presque) "à l'Anglaise"?


Sur la question du Text and Data Mining, c'est cette fois-ci la position des députés qui l'a emporté, et c'est une bonne nouvelle, tant il est vrai que le texte du Sénat limitait beaucoup trop strictement et absurdement son champ d'application: n'étaient couvertes par une exception que les extractions à partir de corpus faisant l'objet d'abonnements institutionnels, tandis que les contenus en libre accès sur le web restaient hors de portée.

Est désormais consacrée une exception au droit d'auteur au profit des chercheurs, inspirée de la loi britannique de 2014, comme l'expliquait le député Luc Bélot lors de la conférence de presse. Sera ajouté dans le Code de la Propriété intellectuelle un alinéa précisant que l'auteur d'une oeuvre divulguée ne peut interdire "Les copies ou reproductions numériques réalisées à partir d'une source licite, en vue de l'exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à l'exclusion de toute finalité commerciale."

On remarquera l'ajout, par rapport au texte voté par les députés en janvier, de la mention "incluses ou associées aux écrits scientifiques" :


Et là, on peut s'interroger sur le sens global de l'article après cet ajout. Cela pourrait signifier que d'un côté, la fouille de textes peut s'appliquer à n'importe quel corpus pris sur le web, quelle que soit sa thématique, mais que, de l'autre, la fouille de données ne s'appliquerait qu'aux données de la recherche, à condition qu'elles soient incluses ou associées à un écrit scientifique.

Cette interprétation, si elle est confirmée, génère plusieurs remarques ou interrogations :

1) La nouvelle mouture de l'article 18 bis ne retombe pas dans le travers de l'article voté par les sénateurs, dans la mesure où le champ de l'exception ne se limite plus aux corpus accessibles via des "contrats conclus par un éditeur avec un organisme de recherche ou une bibliothèque".

2) Pour autant, la fouille de données ne pourrait pas porter sur n'importe quel type de données brutes: il faut que ces données soient préalablement "incluses ou associées" à un écrit scientifique. Un chercheur qui copierait des milliers de pages d'un réseau social afin d'en extraire des données ne pourrait invoquer l'exception de TDM. C'est la solution contractuelle qui continuera à s'appliquer : notre chercheur devra négocier avec le producteur de la base de données le droit de procéder à une extraction de données... Ou se contenter de l'API fournie par le producteur quand elle est proposée. Poussons le raisonnement jusqu'à l'absurde : si ce même chercheur décide de réutiliser des données relatives à un réseau social et mises à disposition par un homologue étranger par le biais d'un écrit scientifique, notre chercheur français serait probablement, cette fois-ci, couvert par la nouvelle exception.

3) La limitation du champ d'application de l'exception de la fouille de données (on ne parle pas ici de la fouille de textes) aux données de la recherche rend la formulation redondante avec celle de l'article 17, qui, comme on l'a vu, énonce que les données de le recherche sont "librement réutilisables". Autrement dit, l'article 17 ouvrait déjà la possibilité de TDM sur les données de la recherche, et ce, sans la condition que lesdites données soient "incluses ou associées aux écrits scientifiques". 

4) Plus globalement, le régime d'application différencié de l'article 18 bis, fondé sur la dichotomie texte/données repose sur le postulat d'une différence nette entre texte et données. Or la distinction n'est que très superficielle, tout corpus de textes étant traduisible en langage informatique par un ensemble de 0 et de 1.

***


Pour finir, sans vouloir jouer l'avocat du diable, je conseillerais aux chercheurs français d'adopter un automatisme de langage : au lieu de dire qu'ils font de la fouille de données, je leur suggérerais de dire qu'ils font de la fouille de textes (une base de données composée intégralement de chiffres n'est-elle pas, par certains côtés, un gigantesque texte d'un genre particulier?) Par ce simple tour de passe-passe sémantique, ils feraient entrer plus facilement leur projet de recherche dans les clous de la nouvelle exception aux contours alambiqués.


samedi 9 avril 2016

Un train peut en cacher un autre

Mise à jour du 24 avril. 

La mise à jour est double. Tout d'abord, il me faut apporter une correction importante. L'amendement Mélot voté en commission des lois fait bien obstacle, contrairement à ce que j'ai écrit, aux clauses entravant la fouille de données par l'adjonction de contraintes de toutes sortes puisqu'il y est précisé que "l’autorisation de fouille ne donne lieu à aucune limitation technique". Ensuite, après des discussions internes au sein du collectif SavoirsCom1, nous en sommes arrivés à la conclusion, que nous avons formalisée dans un communiqué, que l'amendement Mélot "constitue sans doute le moins mauvais compromis possible en l’absence d’une évolution du Code de la Propriété Intellectuelle (...) La limitation du champ d’application des activités de TDM aux publications scientifiques mises à disposition en vertu des «contrats conclus par un éditeur avec un organisme de recherche ou une bibliothèque» est une solution de compromis qui va aussi loin que possible en l’absence d’une révision du Code de la Propiété Intellectuelle." L'amendement Mélot permet en effet d'éviter une situation de blocage absolu, assez inévitable tant que le gouvernement n'envisagera pas sérieusement de faire voter une nouvelle exception au droit d'auteur en faveur du TDM, quand bien même cette nouvelle exception apparaîtrait en contradiction avec le droit communautaire, lequel prévoit une liste fermée d'exceptions en vertu de la directive "Infosoc" de 2001.


Dans le précédent article, j'ai essayé de montrer comment les lignes étaient en train de bouger, tant au niveau national qu'européen pour ce qui touche au Text and Data Mining. Cependant, le propos était par trop optimiste et ne prenait pas en compte l'adoption de l'amendement présenté par Mme Mélot au nom de la commission Culture. S'oriente-t-on vers une consécration par la loi pour une République numérique, d'une exception de Text and Data mining? Pas vraiment en fait : il n'y aura pas d'exception générale de TDM, mais un aménagement particulier dans le contexte des abonnements institutionnels. L'amendement adopté par la Commission des lois est un amendement de compromis qui veut ménager la chèvre et le chou. D'un côté, ne pas contrevenir à la législation européenne actuelle sur le droit d'auteur et se garder d'anticiper sur la solution, incertaine, qui sera choisie par les autorités européennes au terme de la réforme. De l'autre, prendre en compte les nouveaux besoins de la recherche en invalidant les clauses interdisant le TDM dans les abonnements souscrits par des organismes de recherche ou des bibliothèques. L'amendement retenu propose une complète réécriture de la précédente version votée par les députés :

"Dans les contrats conclus par un éditeur avec un organisme de recherche ou une bibliothèque ayant pour objet les conditions d’utilisation de publications scientifiques, toute clause interdisant la fouille électronique de ces documents pour les besoins de la recherche publique, à l'exclusion de toute finalité directement ou indirectement commerciale, est réputée non écrite. L’autorisation de fouille ne donne lieu à aucune limitation technique ni rémunération complémentaire pour l’éditeur.
La conservation et la communication des copies techniques issues des traitements, aux termes des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes dont la liste est fixée par décret.
Le présent article est applicable aux contrats en cours."

un train peut en cacher un autre

On peut interpréter cet amendement de façon positive comme une première brèche dans la muraille du droit des producteurs de bases de données.

Mais il faut aussi souligner la portée limitée de la disposition.

D'une part, s'il est vrai que les clauses contenues dans les licences signées entre les éditeurs et les établissements publics interdisant le TDM seront réputées non écrites, il n'en restera pas moins que les clauses entravant la fouille de données par l'adjonction de contraintes de toutes sortes resteraient parfaitement légales. Les éditeurs scientifiques resteront libres de contraindre les chercheurs à utiliser exclusivement leur API, ou à ne pas dépasser un nombre-limite de requêtes hebdomadaires, ou bien un nombre-limite de caractères par extraction. Le protocole d'accord de janvier 2014 (amendé par la suite) entre Elsevier et le consortium Couperin permet de mesurer combien l'imagination des éditeurs est sans limites dès qu'il s'agit de créer des entraves à la pratique du TDM.

D'autre part, et de façon plus générale, dès lors que la fouille de données portera sur un corpus pris sur le web en dehors du périmètre des ressources souscrites par l'établissement d'appartenance du chercheur, la fouille de données ne sera pas couverte par la moindre exception. On retournera alors à une situation parfaitement identique à la situation actuelle. Les chercheurs devront négocier pied à pied avec les producteurs de bases de données (quand ils sont identifiables) le droit de procéder à une extraction de données. De sorte que seules primeront les solutions contractuelles.

Suivant l'avis de la Commission Culture du Sénat, la Commission des lois a donc fait le choix d'un compromis absurde selon lequel ne seront couvertes que les extractions à partir de corpus faisant l'objet d'abonnements institutionnels, tandis que les contenus en libre accès sur le web resteront hors de portée. La solution n'est pas acceptable en l'état. Espérons que les discussions ultérieures amèneront les parlementaires à revoir leur copie.










jeudi 7 avril 2016

Open Access dans le projet de loi pour une République numérique: vers une issue heureuse?

Après un long silence personnel causé pour partie par le sentiment d'exaspération et de lassitude extrême de relire çà et là sous la plume de porte-parole de maisons d'édition ou d'éminents représentants des sciences sociales, le ressassement sempiternel de peurs irrationnelles et de prophéties apocalyptiques, je reprends mon clavier et je tente de faire le point sur les espoirs que fait naître le projet de loi Lemaire en matière d'Open Access. Les dernières discussions en commission des lois au Sénat sont plutôt encourageantes. Avant que de les évoquer, faisons un retour en arrière sur les dernières péripéties qui ont accompagné la gestation du texte de loi.

Back to the recent past...


 Le texte a été mis au vote à l'Assemblée Nationale à la mi-janvier.

Pour ce qui concerne le "droit d'exploitation secondaire" des chercheurs, la version de l'article 17 finalement retenue par les parlementaires, établissait que
" I. – Lorsqu’un écrit scientifique issu d’une activité de recherche financée au moins pour moitié par des dotations de l’État, des collectivités territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne est publié dans un périodique paraissant au moins une fois par an, son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur, du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l’accord des éventuels coauteurs, toutes les versions successives du manuscrit jusqu’à la version finale acceptée pour publication, dès lors que l’éditeur met lui-même celle-ci gratuitement à disposition par voie numérique et, à défaut, à l’expiration d’un délai courant à compter de la date de la première publication. Ce délai est de six mois pour une publication dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et sociales. Un délai inférieur peut être prévu pour certaines disciplines, par arrêté du ministre chargé de la recherche.

« La version mise à disposition en application du premier alinéa ne peut faire l’objet d’une exploitation dans le cadre d’une activité d’édition à caractère commercial."

Des esprits chagrins ont pu relever que le texte ne mentionnait pas explicitement les "archives ouvertes", et, de façon plus grave, que les délais pour la libération des articles n'étaient pas limités strictement à "six mois tout au plus" et "douze mois tout au plus". Calqué sur le modèle de la loi allemande d'octobre 2013,  l'article 17 a été pensé comme un levier pour inciter les chercheurs à diffuser largement leurs publications, sans le leur imposer, les chercheurs restant les seuls tributaires du droit de déposer ou non leurs articles dans des archives ouvertes. Il est vrai que, tout comme la loi allemande, le texte définit un cadre très peu contraignant. Mais disons qu'il s'agit d'un bon début qui ouvre la voie à d'autres textes ultérieurs plus ambitieux. De plus, à y bien regarder, le saut juridique n'est pas un saut de puce, le dispositif de l'article 17 ayant pour effet d'invalider toute disposition contractuelle: "les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite" (§ IV du même article) Enfin, un délai d'embargo plus court était toujours possible en vertu d'un arrêté pris par le ministre chargé de la recherche pour certaines disciplines (cette disposition vient de sauter à l'issue des discussions au sein de la commission des lois du Sénat, du fait du risque d'insécurité juridique qu'elle engendrait)


Pour ce qui est de l'exception de Text and Data Mining, on peut dire que, dans un premier temps, le gouvernement aura tout fait pour qu'elle ne voie pas le jour. Son rejet de l'exception était fondé sur un risque d'incompatibilité avec le droit européen: ajouter une nouvelle exception à la liste fermée des exceptions de la directive « Infosoc » de 2001 aurait posé des problèmes dans le contexte européen de révision du droit d’auteur. Sauf que l'argument faisait beaucoup sourire, si l'on songe à nos voisins outre-Manche qui n'ont pas attendu les derniers soubresauts de la réforme européenne du droit d'auteur pour faire voter dès 2014 une exception de TDM à des fins de recherche. Pour parvenir à ses fins, c'est-à-dire offrir à l'exception de TDM un enterrement de première classe, le gouvernement a ensuite tenté d'allumer des contre-feux. C'est à ce moment-là qu'a germé dans l'esprit éclairé de quelques têtes pensantes du Ministère de la Culture, l'idée de commander un rapport à un comité Théodule, sur l'air trop bien connu de: "il est trop tôt pour voter, c'est un sujet beaucoup trop complexe et nouveau, attendons les résultats du rapport .." Et de missionner dans la foulée, dès le 21 janvier, Charles Huot,qui n'est autre que le président du Groupement français de l’industrie de l’information (GFII), association qui regroupe l’ensemble des acteurs de la chaîne de l’information spécialisée, au premier rang desquels les éditeurs scientifiques. Or  le Text and Data Mining consiste notamment en l'exploitation automatisée de corpus d'articles provenant de plates-formes de revues scientifiques. Dans ce contexte, le président du GFII est-il la personne la mieux qualifiée pour livrer un rapport impartial sur la possibilité de mettre en oeuvre un cadre légal définissant les conditions d'exercice d'une exception de TDM? D'après des propos échangés à l'occasion d'une réunion inter-ministérielle, ledit rapport opterait pour une solution de type contractuel, tant décriée depuis bon nombre d'années du fait de son inadaptation aux modalités d'exercice de la fouille de données. C'est à croire que Charles Huot n'aurait auditionné que des chercheurs hostiles à l'exception de TDM. C'est ce qui s'appelle être juge et partie.

Retour au passé proche: arrive le 22 janvier, jour du vote au sujet de l'exception de TDM. Premier coup de théâtre: contre l'avis du rapporteur Luc Belot, contre l'avis du gouvernement et malgré les manœuvres dilatoires de ce dernier, l'exception de TDM est adoptée. Des députés proches de la majorité s'insurgent: ils n'avaient pas eu le temps d'appuyer sur le bouton! Il était à peu près 20h, le gouvernement avait la possibilité, en jouant sur les règles de procédure, de demander une deuxième délibération à la suite de l'examen de l'ensemble des articles et avant la fin de la clôture de séance. Sauf que, pour des raisons qui tiennent soit à un oubli, soit à une grosse fatigue de fin de soirée, soit à un calcul de probabilité sur les risques d'être battu une seconde fois au vu des sensibilités politiques auxquelles se rattachaient les derniers élus présents dans l'hémicycle à 2h du matin, le gouvernement n'a pas fait la demande d'une seconde délibération. Et c'est ainsi que l'article 18 bis est resté validé nuitamment.

Au final, une fois amendé, le texte de loi dans son ensemble aura permis à la Secrétaire d'Etat Axelle Lemaire de réaliser un score historique, avec 356 votes favorables sur 357 votes exprimés et un seul vote contre.

And now, back to the present...


Depuis le début du printemps, l'heure est au dégel.  A la commission des lois du Sénat, le 6 avril, l'article 17 a été validé, moyennant un toilettage superficiel. Les paragraphes II et III de l'article 17 qui posent le caractère librement réutilisable des données de la recherche ("Dès lors que les données issues d’une activité de recherche, financée au moins pour moitié par des dotations de l’État (...) ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur (...) leur réutilisation est libre.") sont restés totalement inchangés.

Quant à l'exception de TDM, le gouvernement a certes soumis un amendement demandant le retrait de l'article 18 bis. Mais, non seulement le gouvernement n'a pas été suivi, mais il n'a, semble-t-il que mollement défendu l'amendement. Suite aux délibérations, ce dernier est donc désormais qualifié de "satisfait ou sans objet". Cela laisse à penser que le gouvernement ne souhaite plus suivre la même ligne de conduite qu'auparavant, laquelle se résumait à attendre... que l'Union Européenne statue dans le cadre de son programme de réforme du droit d'auteur.

Comme le rapporte Pierre-Carl Langlais, Thierry Mandon, Secrétaire d'Etat chargé de l'Enseignement Supérieur et de la Recherche a tenu des propos sans ambiguïté au moment même où se tenaient les discussions en commission des lois: « La réforme européenne prendrait au moins trois ou quatre ans. Si nous l’attendons, et que nous ne mettons pas en place une forme d’exception, c’est mort »

Curieusement, ces velléités de passer à la vitesse supérieure se font jour au moment où l'Union Européenne paraît elle-même changer de ton sur le sujet. En janvier, pendant que l'Assemblée Nationale discutait du texte de loi, le Parlement Européen faisait savoir qu'il s'interrogeait sérieusement sur le bien-fondé du droit des bases de données, lequel constitue l'un des soubassements idéologiques et juridiques à partir desquels s'élève la forteresse dans laquelle sont retranchés les éditeurs : sans droit des bases de données, la forteresse s'écroule comme un château de cartes, car la revendication par les producteurs de bases de données du droit de contrôler et de limiter le produit des fouilles de données perd son fondement.

Plus près de nous, la commission européenne en la personne de Carlos Moedas, le Commissaire européen à la recherche, à l'innovation et à la science, multiplie depuis quelques jours les déclarations de soutien aux politiques de promotion de l''Open Science. Après un premier discours ambitieux quoique un peu flou ce lundi, Carlos Moedas a décidé d'afficher clairement son soutien au vote du projet de loi Lemaire, via une courte vidéo diffusée sur les réseaux sociaux, le 6 avril, soit très exactement au moment même des discussions en commission des lois au Sénat:
 "Il nous faut clarifier les normes du droit d'auteur. L'Europe doit clarifier le cadre législatif pour l'accès et l'utilisation des données qui ont une finalité de recherche, et notamment en reconnaissant l'utilisation de la technique du Text and Data Mining comme bénéficiaire d'un régime dérogatoire du droit d'auteur".



Dans son allocution, Carlos Moedas  approuve donc la mise en place d'un dispositif qui s'apparente à une exception de Text and Data Mining. Voilà qui coupera l'herbe sous le pied des tenants du statu quo, lesquels invoquent le risque d'incompatibilité de l'exception française de TDM au regard du cadre juridique européen.

And soon, back to the future ?

Si le gouvernement semble modifier son cap en matière d'Open Access, c'est aussi parce que la mobilisation des chercheurs a pesé sur la redéfinition de sa feuille de route. Ce n'est pas le moment de faiblir... C'est pourquoi il faut inviter le plus grand nombre de nos concitoyens, qu'ils soient chercheurs ou non, à signer cette pétition:
"Pour une science ouverte à tous"

samedi 12 décembre 2015

Projet de loi pour une République numérique : un bon thriller pour les chercheurs

[Mise à jour du 12 décembre : ajout d'une note 1 en fin d'article sur le régime de libre réutilisation des données de la recherche, ou comment un régime de réutilisation similaire à celui des licences Creative Commons fait son entrée dans la loi]

[Article remanié/corrigé le 11 décembre à 11h15, principalement pour ce qui touche aux données de la recherche]


Depuis quelques jours, plusieurs nouveaux épisodes sont venus enrichir la saga du projet de loi Lemaire. La semaine dernière, le gouvernement répondait aux contributions qui n'ont pas été retenues dans le cadre de la consultation numérique. Mercredi 9 décembre, de nouveaux rebondissements ont émaillé la série : le gouvernement a rendu public un avis extrêmement critique du Conseil d'Etat sur le texte, tandis que le gouvernement a soumis à l'Assemblée Nationale la version définitive du projet de loi, qui sera débattu par les parlementaires en procédure accélérée.
Le même jour, la commission européenne a dévoilé sa "vision" pour moderniser les règles du droit d'auteur dans le cadre de la révision de la directive "Infosoc". Or parmi les propositions formulées, issues pour partie du rapport de la députée Julia Reda, figure l'exception de Text and Data Mining, tant réclamée par les chercheurs.
Tous ces ingrédients réunis permettent de concocter un bon thriller...


Text and Data Mining : l'invité-fantôme qui est là sans être là


Par Bonnybbx. CC0. Source : Pixabay

On peut se demander pourquoi l'exception de fouille de données, présente dans l'une des versions de l'avant-projet qui avait "fuité" cet été, ne figure toujours pas dans la dernière version du projet de loi. Des éléments de réponses sont à trouver dans les motivations apportées par le gouvernement au rejet de certaines propositions lors de la consultation. En fait, la réponse est toujours la même (voyez ici, , ou encore ) :

Il y a aujourd’hui un consensus pour reconnaître que le text and data mining (TDM) représente un enjeu majeur d’innovation, mais aussi de positionnement concurrentiel pour la recherche, notamment vis-à-vis de pays comme le Royaume-Uni. La voie contractuelle, qui nécessiterait une négociation éditeur par éditeur, s’est montrée inadaptée à ce jour pour permettre l’application des techniques de TDM à de grands ensembles de corpus, à des fins de recherche.

La voie législative, qui introduirait une nouvelle exception au droit d’auteur, supposerait pour sa part de mettre en place des garanties permettant de répondre aux inquiétudes des éditeurs, en particulier face au risque de dissémination des copies numériques. Cette garantie pourrait être offerte par l’intermédiation d’un tiers de confiance. A cet égard, il est à noter que la Bibliothèque nationale de France (BnF) s’est d’ores et déjà portée candidate pour jouer un tel rôle.
La concertation entre le ministère de l’éducation nationale de l’enseignement supérieur et de la recherche et le ministère de la culture et de la communication se poursuit sur ces questions, dans le contexte de la révision en cours de la directive européenne sur le droit d’auteur.
Le gouvernement ne ferme pas totalement la porte à la possibilité d'une telle exception, mais il ne veut pas perturber les discussions en cours au niveau de l'Union Européenne sur l'exception de TDM. Contrairement au Royaume-Uni, il fait dépendre sa consécration par la loi et sa mise en oeuvre, de l'adoption préalable par le Conseil de l'UE, de la prochaine directive sur le droit d'auteur.

Mais l'UE est-elle vraiment déterminée à consacrer une exception de Text and Data Mining ? On peut, à l'instar de la League of European Research Universities (LERU), en douter :

[The Commmunication] says that the Commission is assessing options and will consider legislative proposals. The Commission has had years to consider options and proposals. It is time to stop considering and to start implementing. The time for action is now. LERU is disappointed that the legislative programme is not addressed in a more convincing and coherent way.


Droit d'exploitation secondaire : le Conseil d'Etat est son ennemi...


Zombie attack

Le texte soumis pour avis au Conseil d'Etat prévoyait un "droit d'exploitation secondaire" ("Zweitverwertungsrecht" dans la loi allemande de janvier 2014 dont s'inspire très fortement le texte) au profit des auteurs, les autorisant à mettre à disposition gratuite leurs articles dans la version éditeur finale du manuscrit acceptée pour publication, passé un délai de 6 mois pour les Sciences, Techniques, Médecine (STM), et 12 mois en Sciences Humaines et Sociales (SHS).
Mais dans l'avis du 3 décembre, rendu public par le gouvernement le 9, le Conseil d'Etat expédie sauvagement cette possibilité au nom du principe de la territorialité des lois :
En ce qui concerne la mise à disposition gratuite sur l’internet des résultats de recherches financées sur fonds publics, prévue par l’article 14, le Conseil d’Etat a relevé que l’impact d’une telle mesure sur les contrats futurs entre éditeurs et auteurs tenait à son caractère d’ordre public, lequel ne peut jouer que sur le territoire français, alors que l’effet de la diffusion sur l’internet est mondial. Cette incohérence lui a paru faire obstacle à l’adoption de cette mesure.
Le raisonnement paraît curieux; le Conseil d'Etat estime que, puisque la diffusion des articles via Internet atteint potentiellement une audience mondiale, il ne devrait pas être possible de légiférer (nationalement) sur le statut des articles de recherche. Est-ce à dire que les lois votées récemment par l'Allemagne, l'Italie, l'Espagne ou bien l'Argentine ou les Etats-Unis devraient être invalidées ?

Heureusement, dans un twist digne des meilleures intrigues, le gouvernement n'a pas suivi l'avis du Conseil d'Etat, de sorte que l'actuel article 17 maintient la possibilité d'une diffusion en accès libre des travaux scientifiques financés sur fonds publics (au moins 50 %), au terme d'une durée d'embargo inchangée : 6 mois en STM, 12 mois en SHS.

L'étude d'impact de la loi prévoit en outre un plan d'accompagnement des revues en SHS à la transition vers le libre accès, qui pourrait être mis en oeuvre dès 2016. "Le plan, ciblé sur les revues de recherche de haut niveau, s'adresse aux revues françaises, voire francophones, sélectionnées sur une base scientifique". Deux options seront offertes : "passage à une barrière mobile ramenée à 12 mois, ou libre accès immédiat, options qui peuvent être panachées en fonction du choix des revues".


Données de la recherche : elles sont entrées par la grande porte, leurs ennemis les feront peut-être sortir par la fenêtre...



Crasch

Dans la précédente version du texte, les données de la recherche étaient qualifiées de "choses communes" au sens de l'article 714 du Code Civil :
Il est des choses qui n'appartiennent à personne et dont l'usage est commun à tous.
Des lois de police règlent la manière d'en jouir.
Cette qualification avait pour mérite de faire resurgir au détour d'un article, la notion de commun de la connaissance, et ce, en dépit de la disparition de l'ex-aticle 8 qui consacrait plus globalement un "domaine commun informationnel". Le concept de "choses communes" permettait également d'ancrer la notion de commun dans un temps long, qui trouve ses origines dans le droit romain.

Le Conseil d'Etat a rejeté la qualification de "choses communes" en l'absence d'une véritable étude d'impact :

En outre, le Conseil d’Etat n’a pu retenir cette disposition ainsi que celle qui qualifie de « choses communes » au sens de l’article 714 du code civil les données issues de recherches financées sur fonds publics et qui permet la libre réutilisation de ces données une fois publiées, au motif qu’il n’a pas disposé d’une véritable étude des impacts positifs ou négatifs, juridiques aussi bien qu’économiques qu’on peut en attendre.

Avant la publication de l'avis du Conseil d'Etat, d'autres critiques sur la notion de "choses communes" avaient été émergé ici ou là. Du point de vue du droit, Me Jean Martin, avocat chargé par le Conseil Supérieur de la Propriété Littéraire et Artistique (CSPLA) de produire un rapport sur la notion de domaine commun informationnel, avait soulevé la question de l'articulation entre Code Civil et Code de la Propriété Intellectuelle, sur la base de la définition jurisprudentielle complexe de "lois de police". D'un point de vue philosophique, Dardot et Laval ont démontré que le Commun doit se définir comme la résultante d'une activité commune de co-construction et non comme une chose en soi, déterminée par nature.

Le gouvernement a donc remanié le texte en évacuant la notion de "choses communes". Après cet énième remaniement du texte, les communs informationnels sortent du dispositif de la loi par la petite porte. Le nouveau texte maintient néanmoins un régime de libre réutilisation pour les données de la recherche:
« II. – Dès lors que les données issues d’une activité de recherche, financée au moins pour moitié par des dotations de l’État, des collectivités territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne, ne sont pas protégées par un droit spécifique, ou une réglementation particulière, et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre.

« III. – L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication.

« IV. – Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite. »
Cependant, en l'état, le régime de libre réutilisation appliqué aux données de la recherche n'est pas totalement garanti. Le texte dit bien : dès lors que les données de la recherche "ne sont pas protégées par un droit spécifique". L'exposé des motifs est encore plus précis : "dès lors que ces données ne sont pas protégées par un droit spécifique, comme par exemple un droit de propriété intellectuelle". Le texte envisage probablement des cas où les données de la recherche sont des images ou des sons sur lesquels les auteurs détiennent des droits de propriété intellectuelle et n'en autorisent pas explicitement la libre réutilisation, s'ils n'ont pas opté pour l'apposition d'une licence Creative Commons.[1]

La formulation n'est pas totalement claire, et laisse la possibilité d'un autre type de conflit : le texte ne fait pas formellement barrage au droit des bases de données. Le producteur d'une base pourrait invoquer le droit sui generis de producteur de base de données, pour revendiquer la captation des données sous-jacentes aux articles déposés dans la base de données.

Le § III a probablement été conçu comme une réponse, un pare-feu. Il prévoit que l'éditeur scientifique ne peut limiter la réutilisation des données de la recherche. Deux types de réserves peuvent être apportés. D'abord, le renvoi au § I laisse à penser que ne sont envisagées que les données "sous-jacentes" à chaque article. Quid des jeux de données déposés de façon autonome sur des plates-formes dédiées mises à disposition par des éditeurs scientifiques ? Dans ce cas de figure, l'éditeur scientifique est-il en mesure de revendiquer son droit de producteur de base de données ? Ensuite, du fait que le § I porte sur les articles pris isolément, il n'est pas certain que le dispositif du § III bloque le déclenchement du mécanisme du droit des bases de données, qui porte sur un corpus de documents mis à disposition sur une plate-forme. La formulation du § III mériterait donc d'être précisée.

On peut espérer que l'article sera remanié prochainement lors des discussions, même limitées (puisque le texte sera voté en procédure accélérée) sur les bancs de l'Assemblée et du Sénat. D'immanquables nouveaux twists sont à prévoir...

[1] Mise à jour du 12 décembre. Je m'aperçois qu'il y a quelque chose d'un peu absurde à dire que les données de la recherche seraient donc libres d'utilisation... sauf si elles ne sont pas. C'est un peu comme si, en cette période d'état d'urgence, on réécrivait l'article 1 de la Déclaration des Droits de l'Homme et du Citoyen de la façon suivante : "Les hommes naissent et demeurent libres et égaux en droits.. dès lors qu'ils ne sont pas emprisonnés ni traités de façon inégale." Ou bien les données de la recherche sont libres de réutilisation et en ce cas, aucun droit de propriété intellectuelle ne peut en limiter la libre réutilisation, ou bien elles sont placées sous un faux régime de libre réutilisation, révocable à merci dès lors que les auteurs y opposent des droits de propriété non assortis d'une autorisation expresse de libre réutilisation.
Il faudrait exactement comprendre ce qu'entendent les rédacteurs par "Dès lors que les données issues d’une activité de recherche (..) ne sont pas protégées par un droit spécifique, ou une réglementation particulière". En dehors des droits de propriété intellectuelle, d'autres droits peuvent être mobilisés.


Ce qu'il faut surtout retenir de la formulation du § II de l'article 17, c'est que les données de la recherche sont désormais placées sous un régime de libre réutilisation. Cela signifie qu'il ne sera pas nécessaire de demander une autorisation expresse pour réutiliser les jeux de données. A y bien réfléchir, Cela revient à placer les données de la recherche sous un régime de réutilisation semblable à celui qui sous-tend les Creative Commons.

Précisons que ce régime ne dispensera pas du respect de certains droits réservés, comme par exemple la mention de la paternité ou de la source des données.
In fine, deux des amendements que le collectif SavoirsCom1 avait proposés ont été partiellement repris sous une formulation certes très différente, dans le texte déposé à l'Assemblée :
« Lorsqu’il s’agit de données de la recherche au sens qui en est donné par l’OCDE dans le rapport paru en 2007 et intitulé « Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics », les chercheurs ne peuvent revendiquer de droits de propriété intellectuelle sur les jeux de données, hormis apposer une licence imposant la mention de la paternité et le partage à l’identique. » 
(...) 
« Les chercheurs ne peuvent revendiquer de droits d’auteur sur les jeux de données, hormis apposer une licence imposant la mention de la paternité et le partage à l’identique. »

En proposant ces deux amendements, nous avions à l'esprit la licence CC-BY-SA: Creative Commons, mention de la paternité et partage à l'identique.

Si les données de la recherche sont placées sous un simple régime de libre réutilisation, la condition de partage à l'identique est évacuée. En revanche, la formulation du projet de loi permet d'englober les cas de réutilisation des jeux de données sans mention de la source/paternité. Cela correspond à des licences du type CC0 (Creative Commons Zéro) ou PDDL (Public Domain Dedication and Licence).

Le parallèle avec les licences de type Creative Commons s'arrête là : avec la loi numérique, on passe du terrain du contrat à celui de la loi.









lundi 9 novembre 2015

Open Data et Open Access dans le projet de loi Lemaire : avancées et limites

[Mise à jour: le 24 novembre 2015, la Commission Mixte Paritaire n'a finalement pas retenu l'amendement du sénateur Hugues Portelli visant à placer les données de la recherche sous un régime dérogatoire.]


Axelle Lemaire, secrétaire d'Etat chargée du Numérique, a dévoilé vendredi dernier la dernière version du projet de loi pour une République numérique. Parmi les mesures positives, figure le raccourcissement des délais d'embargo pour le partage gratuit des articles scientifiques, notamment via des dépôts dans des archives ouvertes: en réponse aux fortes demandes exprimées par la communauté scientifique, le CNRS en tête, les délais repassent de 24 à 12 mois pour les sciences humaines et sociales, et de 12 à 6 mois pour les sciences, les techniques et la médecine.

En revanche, il est à regretter que l'exception de Text and Data Mining, présente dans la première mouture de l'avant-projet de loi qui avait "fuité" cet été, ait définitivement disparu, en dépit des promesses du Secrétaire d'Etat en charge de l'Enseignement Supérieur et de la Recherche.

Mais ce sur quoi je voudrais insister (à nouveau) ici, c'est que, nonobstant des avancées significatives en matière d'Open Data, des zones grises subsistent, du fait des contradictions qui découlent de certaines dispositions non compatibles avec un autre texte, le projet de loi de transposition de la directive Public Sector Information de 2013, porté par la Secrétaire d’État Clotilde Valter. Tels la divinité Janus bifrons, les projets de loi Valter et Lemaire regardent dans deux directions opposées.


Janus-Vatican.JPG

Janus-Vatican“ par Fubar Obfusco - Public Domain. Wikimedia Commons.


Open Data : le droit des bases de données neutralisé


Parmi les nouveaux articles ajoutés, figure un article 5 qui comprend deux dispositions nouvelles de nature à faciliter l'ouverture et la réutilisation des données publiques. La première porte précisément sur les relations entre ouverture des données et droit des bases de données.

I. - L’article 11 de la loi du 17 juillet 1978 portant diverses mesures d'amélioration des relations entre l'administration et le public et diverses dispositions d'ordre administratif, social et fiscal est remplacé par les dispositions suivantes: 

« Art. 11. - Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées à l’article L. 300-2 du code des relations entre le public et l’administration au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle ne peuvent faire obstacle à la réutilisation, au sens de l’article 10, du contenu des bases de données que ces administrations ont obligation de publier en application du 3° de l’article L. 312-1 du code des relations entre le public et l’administration.»
Le nouvel article permet de neutraliser les revendications des administrations qui formeraient un barrage contre la réutilisation de leurs données publiques numérisées, en revendiquant le droit sui generis de producteur de bases de données. Cela mettrait un terme à la jurisprudence consacrée récemment par la Cour Administrative d'Appel de Bordeaux dans l'arrêt du 26 février 2015, Société NotreFamille.com c/ Conseil Général de la Vienne, confirmant le jugement rendu en première instance par le Tribunal Administratif de Poitiers l'année précédente.


Vers une simplification des conditions de réutilisation


Reprenant en partie un amendement proposé par le CNNum, le même article vise à imposer aux administrations une liste fermée de licences-types destinées à être apposées aux jeux de données libérés :

III. - L’article 16 de la même loi est complété par un alinéa ainsi rédigé: « Pour les réutilisations à titre gratuit, les administrations mentionnées à l’article L. 300-2 du code des relations entre le public et l’administration recourent à une licence figurant sur une liste fixée par décret. Lorsqu’une administration souhaite recourir à une licence ne figurant pas sur cette liste, cette licence doit être préalablement homologuée par l’Etat, dans des conditions fixées par décret.»

Une politique Open Data digne de ce nom n'est possible que si elle s'accompagne d'une clarification des conditions de réutilisation: si chaque administration concocte sa propre licence ad hoc, la réutilisation devient inutilement complexe, voire impossible.


Données de la recherche : le chat de Schrödinger 


Les données de la recherche sont consacrées par la loi Lemaire au rang de "choses communes", conformément à l'amendement déposé par le collectif SavoirsCom1:

« II. – Les données de la recherche rendues publiques légalement issues d’une activité de recherche financée au moins pour moitié par des fonds publics et qui ne sont pas protégées par un droit spécifique sont des choses communes, au sens de l’article 714 du code civil

Les données de la recherche sont rendues inappropriables... Mais un amendement récemment présenté contre l'avis du gouvernement par le Sénateur Hugues Portelli, dans le cadre du vote de la loi Valter de transposition de la directive Public Sector Information, a précisément pour effet de placer les données de la recherche sous un régime dérogatoire au principe général d'ouverture des données publiques: 
« Art. 11. – Par dérogation au présent chapitre, les informations figurant dans des documents produits ou reçus pas des établissements et institutions d’enseignement et de recherche dans le cadre de leurs activités de recherche peuvent être réutilisées dans les conditions fixées par ces établissements et institutions. »


Comme le chat de Schrödinger (merci à @calimaq pour cette jolie métaphore), les données de la recherche sont mortes et vivantes, ou plutôt libres et non-libres en même temps: d'un côté les universités ont la faculté d'en limiter la réutilisation (PJL Valter remanié par Portelli), de l'autre les données de la recherche sont des communs de la connaissance, des choses communes, inappropriables en droit, ce qui exclut que les universités puissent restreindre les conditions de leur réutilisation (PJL Lemaire).




Disparition du Domaine Commun Informationnel : vive le Copyfraud !


Les données de la recherche ont désormais le statut de choses communes, soit en d'autres termes, le statut de communs de la connaissance. Mais précédemment, le projet de loi Lemaire consacrait de façon plus large un "domaine commun informationnel". L'ex-article 8 qui le définissait, avait pour objectif de "protéger les ressources communes à tous appartenant au domaine public contre les pratiques d’appropriation qui conduisent à en interdire l’accès". A contrario, maintenant que l'article a disparu, il sera toujours possible pour les administrations de faire ce que la loi n'interdit pas explicitement. La porte reste ouverte au Copyfraud, qui consiste en la revendication abusive de droits sur des œuvres, notamment des œuvres du domaine public, de façon à en restreindre l'accès ou la réutilisation. 

Or le Copyfraud est non pas simplement toléré, mais conforté, voire consacré, par le projet de loi Valter: le texte autorise la perception de redevances sur le produit de la numérisation d’œuvres, y compris des œuvres du domaine public en deux dimensions. Dans le match Lemaire/Valter, au round "Copyfraud", le projet de loi Valter l'emporte par KO (mais bien sûr, tant qu'aucun des deux textes n'est voté, rien n'est joué).

Fencing (1890) (14757509586).jpg
 Licensed under No restrictions via Wikimedia Commons

Reste une question. Nous avons vu plus haut que le nouvel article 5 du projet de loi Lemaire a pour objectif de bloquer la revendication par les bibliothèques, musées ou archives, du droit sui generis des producteurs de bases de données sur les jeux de données issus de la numérisation de leurs fonds. Est-ce que l'article 5 serait de nature à freiner voire bloquer le Copyfraud ? Que nenni ! Le droit est un sport de combat dont les règles du jeu sont à géométrie variable: il suffira aux institutions culturelles nostalgiques de l'exception culturelle, de quitter le terrain du droit des bases de données pour continuer le combat sur le terrain de l'article 3 de la loi LemaireValter [1],  et la partie sera gagnée !

Voilà comment des textes législatifs s'enchaînent, de l'exception culturelle à ce qu'il faudra bien peut-être appeler un jour "l'exception LemaireValter [1]" en passant par le droit des bases de données, de façon à offrir, sous couvert d'un changement permanent, la garantie d'une inaltérabilité des pratiques des institutions culturelles, du moins des plus réfractaires d'entre elles à l'ouverture des données culturelles.

[1] Correctif du 12 novembre. Ah là, là, confondre Lemaire et Valter, ce n'était pas gentil pour Axelle Lemaire, à qui je présente ici mes sincères excuses. (A Mme Valter aussi quand même).