samedi 9 avril 2016

Un train peut en cacher un autre

Mise à jour du 24 avril. 

La mise à jour est double. Tout d'abord, il me faut apporter une correction importante. L'amendement Mélot voté en commission des lois fait bien obstacle, contrairement à ce que j'ai écrit, aux clauses entravant la fouille de données par l'adjonction de contraintes de toutes sortes puisqu'il y est précisé que "l’autorisation de fouille ne donne lieu à aucune limitation technique". Ensuite, après des discussions internes au sein du collectif SavoirsCom1, nous en sommes arrivés à la conclusion, que nous avons formalisée dans un communiqué, que l'amendement Mélot "constitue sans doute le moins mauvais compromis possible en l’absence d’une évolution du Code de la Propriété Intellectuelle (...) La limitation du champ d’application des activités de TDM aux publications scientifiques mises à disposition en vertu des «contrats conclus par un éditeur avec un organisme de recherche ou une bibliothèque» est une solution de compromis qui va aussi loin que possible en l’absence d’une révision du Code de la Propiété Intellectuelle." L'amendement Mélot permet en effet d'éviter une situation de blocage absolu, assez inévitable tant que le gouvernement n'envisagera pas sérieusement de faire voter une nouvelle exception au droit d'auteur en faveur du TDM, quand bien même cette nouvelle exception apparaîtrait en contradiction avec le droit communautaire, lequel prévoit une liste fermée d'exceptions en vertu de la directive "Infosoc" de 2001.


Dans le précédent article, j'ai essayé de montrer comment les lignes étaient en train de bouger, tant au niveau national qu'européen pour ce qui touche au Text and Data Mining. Cependant, le propos était par trop optimiste et ne prenait pas en compte l'adoption de l'amendement présenté par Mme Mélot au nom de la commission Culture. S'oriente-t-on vers une consécration par la loi pour une République numérique, d'une exception de Text and Data mining? Pas vraiment en fait : il n'y aura pas d'exception générale de TDM, mais un aménagement particulier dans le contexte des abonnements institutionnels. L'amendement adopté par la Commission des lois est un amendement de compromis qui veut ménager la chèvre et le chou. D'un côté, ne pas contrevenir à la législation européenne actuelle sur le droit d'auteur et se garder d'anticiper sur la solution, incertaine, qui sera choisie par les autorités européennes au terme de la réforme. De l'autre, prendre en compte les nouveaux besoins de la recherche en invalidant les clauses interdisant le TDM dans les abonnements souscrits par des organismes de recherche ou des bibliothèques. L'amendement retenu propose une complète réécriture de la précédente version votée par les députés :

"Dans les contrats conclus par un éditeur avec un organisme de recherche ou une bibliothèque ayant pour objet les conditions d’utilisation de publications scientifiques, toute clause interdisant la fouille électronique de ces documents pour les besoins de la recherche publique, à l'exclusion de toute finalité directement ou indirectement commerciale, est réputée non écrite. L’autorisation de fouille ne donne lieu à aucune limitation technique ni rémunération complémentaire pour l’éditeur.
La conservation et la communication des copies techniques issues des traitements, aux termes des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes dont la liste est fixée par décret.
Le présent article est applicable aux contrats en cours."

un train peut en cacher un autre

On peut interpréter cet amendement de façon positive comme une première brèche dans la muraille du droit des producteurs de bases de données.

Mais il faut aussi souligner la portée limitée de la disposition.

D'une part, s'il est vrai que les clauses contenues dans les licences signées entre les éditeurs et les établissements publics interdisant le TDM seront réputées non écrites, il n'en restera pas moins que les clauses entravant la fouille de données par l'adjonction de contraintes de toutes sortes resteraient parfaitement légales. Les éditeurs scientifiques resteront libres de contraindre les chercheurs à utiliser exclusivement leur API, ou à ne pas dépasser un nombre-limite de requêtes hebdomadaires, ou bien un nombre-limite de caractères par extraction. Le protocole d'accord de janvier 2014 (amendé par la suite) entre Elsevier et le consortium Couperin permet de mesurer combien l'imagination des éditeurs est sans limites dès qu'il s'agit de créer des entraves à la pratique du TDM.

D'autre part, et de façon plus générale, dès lors que la fouille de données portera sur un corpus pris sur le web en dehors du périmètre des ressources souscrites par l'établissement d'appartenance du chercheur, la fouille de données ne sera pas couverte par la moindre exception. On retournera alors à une situation parfaitement identique à la situation actuelle. Les chercheurs devront négocier pied à pied avec les producteurs de bases de données (quand ils sont identifiables) le droit de procéder à une extraction de données. De sorte que seules primeront les solutions contractuelles.

Suivant l'avis de la Commission Culture du Sénat, la Commission des lois a donc fait le choix d'un compromis absurde selon lequel ne seront couvertes que les extractions à partir de corpus faisant l'objet d'abonnements institutionnels, tandis que les contenus en libre accès sur le web resteront hors de portée. La solution n'est pas acceptable en l'état. Espérons que les discussions ultérieures amèneront les parlementaires à revoir leur copie.










Aucun commentaire:

Enregistrer un commentaire

N'hésitez pas à commenter ce billet !
Scindez votre commentaire en plusieurs parties, si votre message est long (la plateforme Blogger demande de ne pas dépasser 4096 caractères par commentaire).
Avant de le publier, je vous conseille de prendre le temps de le sauvegarder ailleurs (mail, fichier texte, etc), surtout si votre message est long. Car plusieurs lecteurs de ce blog m'ont signalé qu'ils avaient "perdu" le commentaire qu'ils avaient tenté de publier.
En cas de problème, vous pouvez m'envoyer vos commentaires à l'adresse pierre.naegelen@univ-tlse3.fr, et je les republierai sur le blog.