PROJET AUTOBLOG


S.I.Lex

source: S.I.Lex

⇐ retour index

Pourquoi il faut résister à la taxation des lectures publiques et des Heures du Conte en bibliothèque

samedi 12 novembre 2016 à 11:33

Il y a déjà eu plusieurs alertes ces dernières années à ce sujet, mais la menace semble à présent en passe de se concrétiser. Le site de la Gazette des Communes publie cette semaine un article dans lequel on apprend que la SCELF (Société Civile des Editeurs de Langue Française) souhaite mettre en place un barème pour soumettre les bibliothèques à redevance lorsqu’elles organisent des lectures publiques d’oeuvres protégées par le droit d’auteur. Après un premier courrier envoyé aux mairies qui a servi de coup de semonce, la SCELF va rencontrer l’Association des Bibliothécaires de France la semaine prochaine pour discuter de ces nouvelles orientations.

shut-up

Parmi les animations en bibliothèque qui pourraient être soumises à redevance, on trouve les Heures du Conte, ces séances que les bibliothécaires organisent, souvent avec des parents, pour faire la lecture de livres aux enfants. En 2014, une première alerte avait déjà eu lieu à ce sujet et le collectif SavoirsCom1 s’était mobilisé pour réclamer le maintien de la gratuité et de la liberté d’organisation de telles activités. En Belgique, les choses ont déjà basculé depuis 2012, à partir du moment où la société de gestion collective SABAM a commencé à réclamer des droits pour les lectures publiques en bibliothèque.

J’ai voulu écrire ce billet pour expliquer en quoi il était important à mes yeux de résister à ces revendications et sur quelles bases juridiques on pourrait le faire (même si la marge de manoeuvre est étroite).

Vers la fin d’une tolérance de fait ?

Depuis plusieurs jours que la nouvelle commence à circuler sur les réseaux sociaux, je vois les réactions de beaucoup de collègues bibliothécaires qui ne comprennent pas comment une activité comme les lectures publiques organisées en bibliothèques pourraient être soumises à autorisation et à paiement, y compris lorsqu’elles sont organisées à titre gratuit (c’est-à-dire que ni le public n’a à payer pour y assister, ni la personne qui lit n’est rémunérée spécifiquement pour cette activité).

Pourtant d’un strict point de vue juridique, la SCELF a raison et elle ne manque pas de le rappeler. Les lectures publiques en bibliothèque sont assimilées par la loi à des représentations (ou communications au public), soumises en tant que telles à l’application du droit d’auteur :

Du côté de la SCELF, on fait d’abord valoir le Code de la propriété intellectuelle et son article L.122-4 qui stipule que « toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’auteur ou de ses ayants-droit ou ayants-cause est illicite. Il en est de même pour la traduction, l’adaptation ou la transformation, l’arrangement ou la reproduction par un art ou un procédé quelconque. »

« Or les lectures publiques au sein des bibliothèques sont bel et bien des actes de représentation, rappelle Nathalie Piaskowski, directrice générale de la SCELF. Et la loi ne fait pas de distinguo entre manifestations payantes et manifestations gratuites. »

Cela signifie que depuis des décennies, ces activités de lecture publique en bibliothèque ne reposaient que sur une simple tolérance de fait, qui pouvait être retirée à tout moment par les titulaires de droits et c’est exactement ce dont il est question aujourd’hui.

Cela renvoie à un problème beaucoup plus général à propos duquel j’ai souvent écrit dans ce blog : seule une partie de l’activité des bibliothèques est réellement couverte par la loi en France. C’est le cas par exemple du prêt de livres depuis 2003, mais beaucoup d’autres services n’ont pas de base légale. Le prêt des CD musicaux par exemple s’est effectué pendant des années sans aucune garantie et la même situation d’illégalité larvée se reproduit à présent  à propos des activités organisées en bibliothèque autour des jeux vidéo (ce que reconnaît explicitement un rapport de l’Inspection Générale des Bibliothèques paru en 2015).

C’est dire que la condition juridique des bibliothèques repose en partie sur du sable et que tout un pan des services rendus aux usagers peuvent à tout moment être remis en question si les titulaires de droits en décident. Nous risquons à présent d’en faire l’amère expérience à propos des lectures publiques : la SCELF a d’ores et déjà mis en place un portail sur lequel les bibliothèques doivent déclarer à l’avance les oeuvres dont elles entendent organiser la lecture en public. Le dispositif prévoit ensuite que la société transmettra la demande à l’éditeur, qui transmettra à son tour à l’auteur pour approbation, avant que la SCELF revienne vers la bibliothèque pour lui appliquer un tarif à l’acte.

C’est donc encore une superbe usine à gaz qui est en train de se monter, vu qu’il ne s’agit pas seulement de soumettre les lectures publiques à une redevance, mais aussi à une demande d’autorisation préalable. La SCELF explique cependant qu’elle serait prête à mettre en place des systèmes de forfaits annuels, sans doute sur le modèle de ce qui existe pour la sonorisation des espaces en bibliothèques. Et dans sa grande mansuétude, elle annonce sa volonté de « tenir compte de la situation spécifique des bibliothèques » en leur appliquant un tarif préférentiel.

Les lectures publiques envisagées comme « préjudice à compenser » ?

Le passage à un tel dispositif aurait des conséquences financières non négligeables pour les bibliothèques (en Belgique, les établissements qui organisent des lectures publiques doivent souvent payer plusieurs milliers d’euros à l’année). Mais il me semble que même si la question budgétaire n’est pas anodine, ce n’est pas le plus important dans cette affaire. Soumettre les lectures publiques gratuites en bibliothèques à redevance, cela revient en effet surtout à considérer cet usage comme un préjudice fait à l’auteur, demandant systématiquement réparation.

Peut-on réellement tolérer une telle vision des choses ? Est-ce que lire des livres aux enfants, lorsqu’on sait l’importance de cette activité dans la construction du goût pour la lecture, peut être vu comme un préjudice infligé à l’auteur ? Est-ce que faire découvrir des textes lus à haute voix dans le cadre d’événements gratuits est une manière de nuire aux oeuvres ? Peut-on simplement dire qu’il s’agit d’une forme « d’exploitation » ? Cette extension du champ des redevances revient à nier l’importance d’une sphère de liberté et de gratuité dans les usages collectifs de la Culture.

Or ne nous y trompons pas : c’est bien l’objectif caché de la manoeuvre. Les titulaires de droits français sont engagés depuis plusieurs années dans une véritable croisade contre toute forme de gratuité. Au nom d’une conception maximaliste du droit d’auteur, ils souhaitent voir disparaître les exceptions au principe de l’autorisation préalable, qu’elles existent en droit ou en fait. Les mêmes organisations qui portent « l’exception culturelle à la française » en bandoulière à Bruxelles et clament que « la culture n’est pas une marchandise » quand il s’agit de s’opposer à des traités de libre échange reviennent en France avec un comportement de comptables et de boutiquiers pour soumettre le moindre usage à la caisse enregistreuse !

C’est au nom de cette idéologie que les lectures publiques deviennent la cible de la SCELF aujourd’hui.

Vous avez dit « gratuité » ?

Sachant que la fameuse « gratuité » des usages en bibliothèques est toute relative. Il faut en effet rappeler une évidence : les livres qui sont lus lors des lectures publiques ont d’abord été achetés et ces dépenses d’acquisitions représentent 230 millions d’euros par an, soit 12, 8% du chiffre d’affaire des éditeurs (selon cette étude réalisée sur l’année 2012). Par ailleurs, on doit ajouter à cela les sommes collectées au titre du droit de prêt, qui s’élèvent en moyenne à 15 millions d’euros par an. Les bibliothèques sont donc d’ores et déjà d’importants pôles de soutien financier à la création littéraire.

On peut cependant être certain que la taxation des lectures publiques ne constituera qu’une première étape et que les titulaires de droits chercheront à soumettre à redevance d’autres types d’activités. Cette semaine par exemple, une discussion sur le groupe Facebook « Jeux Vidéos en bibliothèque » m’a appris qu’une bibliothèque qui a organisé un tournoi « Just Dance » pendant les vacances de la Toussaint avait reçu une facture de la part de la SACEM pour « diffusion d’oeuvres ».

Or là encore, on retrouve le problème de fragilité de la condition juridique des bibliothèques, car la SACEM est sans doute dans son droit. Même si l’établissement paye un forfait annuel pour la sonorisation de ses espaces, la diffusion de musique de jeux vidéo dans le cadre d’un événement ponctuel peut être assimilé à l’organisation d’un « spectacle », ce qui nécessite une déclaration préalable et une redevance spécifique. Voilà le prix à payer pour laisser les activités en bibliothèque s’appuyer sur de simples tolérances de fait…

Quels arguments juridiques pour résister ?

Pour les Heures du Conte, on pourrait néanmoins se dire que cet usage est peut-être couvert par l’exception pédagogique, qui autorise notamment la lecture intégrale de textes protégés. Mais cette disposition n’est qu’imparfaitement articulée avec les activités des bibliothèques. Un enseignant peut tout à fait emprunter un livre en bibliothèque pour le lire ensuite à sa classe ou amener ses élèves dans la bibliothèque pour leur faire des lectures. Mais le périmètre d’application est circonscrit aux établissements scolaires et universitaires et l’exception ne peut directement bénéficier aux activités organisées par les bibliothécaires pour le grand public.

Reste-t-il alors une piste juridique qui permettrait de résister aux revendications de la SCELF ? La marge de manœuvre est très étroite, mais il en existe encore une à mon sens. Comme j’en ai déjà parlé à plusieurs reprises dans S.I.Lex, la Cour Européenne des Droits de l’Homme a développé à partir de 2013 une jurisprudence qui a posé le principe que, même en l’absence d’exception législative, on doit examiner la légalité d’un usage en effectuant une conciliation entre le droit d’auteur et d’autres libertés fondamentales reconnues au sein de l’Union européenne. En France, la Cour de Cassation a commencé depuis 2015 à suivre cette piste en demandant aux juges inférieurs de garantir un équilibre entre le droit d’auteur et la liberté d’expression lorsqu’ils doivent apprécier l’existence d’une contrefaçon. Cela change complètement la façon dont le droit français envisage ces questions, en ouvrant des perspectives de reconnaissance des usages au-delà du carcan restrictif des exceptions.

Pour ce qui est des lectures publiques et des Heures du Conte, on pourrait appliquer un raisonnement similaire et affirmer que ces activités, bien qu’assimilables à des représentations au sens du droit d’auteur, contribuent également à rendre effectifs le « droit à l’éducation », le « droit de participer librement à la vie culturelle » et de « jouir des arts », reconnus par la Déclaration universelle des Droits de l’Homme. Et ceci d’autant plus que lorsque ces activités sont organisées à titre gratuit par les bibliothèques, elles ne causent pas un préjudice disproportionné aux titulaires de droits, bien au contraire étant donné le bénéfice global qu’en retire la société !

Je ne cacherai pas que ce raisonnement est fragile et il n’est pas assuré de l’emporter en justice, car il reste une large place à l’appréciation subjective des juges pour effectuer ce genre de conciliations. Mais l’argument existe en droit et c’est à mon sens ce qui compte le plus. C’est la raison pour laquelle je recommanderais à mes collègues de l’ABF qui rencontreront la SCELF la semaine prochaine de ne pas céder à ses revendications.

Il faut résister, ne serait-ce que pour le principe – et j’ai envie de dire – pour l’honneur !

Pendant ce temps, au Ministère de la Culture…

Si on doit ajouter encore un argument, je dirais qu’évidemment, la question de la rémunération des créateurs est importante, voire même cruciale. On sait que la situation des auteurs s’est dégradée ces dernières années et qu’ils ne sont qu’une proportion infime à pouvoir vivre réellement de leurs droits d’auteur, surtout d’ailleurs dans un secteur comme l’illustration des livres jeunesse. Mais si les auteurs sont dans cette situation, ce n’est certainement pas à cause de la gratuité de certains usages en bibliothèques, mais parce que les taux de rémunération concédés par les éditeurs aux auteurs sont dramatiquement bas.

Par ailleurs, il serait loisible au Ministère de la Culture de mettre en place d’autres formes de soutien à la création littéraire. Mais certains signes montrebt que la priorité ne semble pas aller dans cette direction… On a appris par exemple la semaine dernière que le Ministère  a choisi de signer un contrat avec Microsoft pour équiper les postes de ses agents avec la suite Office, pour un montant de 2 millions d’euros par an. Cette décision a visiblement été prise en dépit du bon sens, car le Ministère admet lui-même que la grande majorité de ses agents utilisent déjà des logiciels libres (LibreOffice) et ce n’est que pour satisfaire une minorité d’entre eux que ces millions vont être dépensées ! Voilà typiquement le genre de choix dilapidant un argent public de plus en plus rare, que l’on pourrait consacrer au soutien de la création plutôt que de le voir aller dans les poches d’un géant américain comme Microsoft.

***

Que l’on n’essaie pas alors de nous faire croire que le but principal de la taxation des lectures publiques en bibliothèques est d’améliorer la condition des créateurs, car il y aurait des moyens bien plus efficaces de le faire. Il s’agit avant tout de s’en prendre à la bibliothèque comme espace d’usages collectifs de la Culture et lieu d’exercice des droits fondamentaux des individus.


Classé dans:Bibliothèques, musées et autres établissements culturels Tagged: Bibliothèques, droit d'auteur, gratuité, heures du conte, lectures publiques, représentation, SCELF

L’exception TDM dans la loi numérique : mérites, limites et perspectives

mercredi 9 novembre 2016 à 22:20

Je poste dans ce billet le support d’une intervention que j’ai été invité à donner lors du colloque « La loi numérique, et après ? » à l’occasion d’un atelier consacré à la question des pratiques de Text et Data Mining.

Je ne vais pas avoir le temps de développer les réflexions figurant dans cette présentation, mais j’en donne ci-dessous les lignes principales. La loi République numérique a consacré une nouvelle exception au droit d’auteur et au droit de producteur de bases de données visant à permettre la « fouille » ou « l’exploration » de « textes ou de données incluses ou associées à des écrits scientifiques ».

Le texte de l’exception est issu d’un compromis qui fut très délicat à trouver au Parlement et il en porte les stigmates. Affecté de plusieurs lacunes et incohérences, il soulève des questions d’interprétation épineuses et il manque encore un (ou deux décrets) pour que l’exception soit réellement applicable. On a pu apprendre lors du colloque que ces décrets étaient actuellement en cours de rédaction au niveau du Ministère de l’Enseignement Supérieur et du Ministère de la Culture.

Lorsqu’on la compare à la situation en Angleterre et aux Etats-Unis, l’exception française paraît au premier abord limitée dans sa portée. Elle permet de faire des reproductions d’oeuvres en vue d’opérations de TDM, mais seulement pour des textes, laissant de côté les images et les oeuvres musicales ou audiovisuelles. Par ailleurs, en ce qui concerne les données, l’exception n’est mobilisable que si les informations sont incluses ou associées à des écrits scientifiques. Cela rendra inopérante l’exception TDM pour traiter des données qui ne seraient pas associées à des publications scientifiques (pensons à des bases de statistiques ou à des données circulant en ligne sur le web). 

Par ailleurs (contrairement aux Etats-Unis ou au Japon), l’exception ne peut pas être utilisée à des fins commerciales, ce qui va exclure son application pour des projets co-financés par des entreprises ou s’effectuant dans le cadre de partenariats publics-privés. Il est même plus que probable que les opérations de TDM ne pourront pas être confiées par des équipes de recherche à des sous-traitants privés contre rémunération. 

Ce que j’ai essayé de montrer dans cette intervention, c’est que les décrets vont avoir une importance décisive pour déterminer si l’exception sera réellement applicable ou non. Il reste en effet un grand flou pour savoir dans quelle mesure elle sera opposable à des restrictions contractuelles ou techniques que des fournisseurs de bases de données continueraient à imposer à des extractions en vue de faire du TDM.

Il manque dans le texte un élément crucial : la précision que cette mesure présente un caractère d’ordre public, à l’image de ce que l’on trouve par contre à l’article 30 de la loi (celui sur le Libre Accès aux publications scientifiques). Ce type de mécanismes garantit que des clauses contractuelles qui seraient contraires à l’exception seront nulles d’effets et il paraît déterminant que le décret mentionne explicitement que c’est le cas, faute de quoi les titulaires de droits risquent de retrouver un pouvoir de contrôle non négligeable sur les pratiques.

Par ailleurs, il y a également des questions d’articulation avec les Mesures Techniques de Protection (MTP) que les fournisseurs de base de données ou les éditeurs pourraient continuer à maintenir pour limiter, ou même supprimer, les possibilités de faire du TDM sur leurs contenus. La jurisprudence française n’est pas favorable aux exceptions dans la balance avec les Mesures Techniques de Protection (voir la fameuse décision Mullholland Drive de la Cour de Cassation, qui a permis à un titulaire de droits de supprimer la possibilité de faire une copie privée en implantant un DRM sur un DVD). L’exception TDM ne figure  par ailleurs même pas dans la liste de celles pour lesquelles la Hadopi peut être saisie pour effectuer une régulation, ce qui privera les communautés scientifiques d’un recours en cas de verrouillage excessif. Le décret devrait donc aussi se pencher sur cette question des limitations techniques, sans quoi des problèmes importants se poseront immanquablement à l’avenir en pratique. 

Enfin, un autre enjeu des décrets d’application sera de déterminer comment les fichiers produits pour effectuer les opérations de TDM pourront être conservés et communiqués. L’exception ne parlant que de reproduction et pas de « représentation », on est hélas certain sur les chercheurs ne pourront pas afficher des extraits des textes reproduits lors de la publication des résultats de recherche (sauf peut-être dans la limite – étroite – de l’exception de courte citation). 

Le texte de loi prévoit par ailleurs que des organismes de conservation seront désignés pour recevoir les « archives du TDM », c’est-à-dire les fichiers produits par reproduction d’oeuvres ou de bases, qui auront servi à effectuer les opérations de fouille. Il a été dit lors du colloque qu’une institution comme la BnF s’est déjà positionnée pour jouer ce rôle de « tiers de confiance », mais d’autres établissements pourraient aussi intervenir (l’INIST par exemple ? Ou le CINES ?). 

Or là aussi, il faudra rester très vigilant, car ce dispositif ressemble beaucoup à celui qui a été mis en place pour la consultation des archives du web à la BnF. On sait que pendant longtemps, ces archives,  pourtant très précieuses pour la recherche,  sont restées accessibles uniquement sur place dans les emprises de la BnF. Ce n’est que récemment que plusieurs bibliothèques supplémentaires en région ont été désignées pour servir également de points de consultation. Si la communication des archives des projets de TDM devait aussi uniquement se faire sur place dans un ou deux établissements en France, autant dire que le bénéfice de l’exception serait relativement limité. Il faut que le décret prévoit des marges de manœuvre pour que les tiers de confiance puissent recommuniquer ou offrir des accès à distance à ces fichiers, pour favoriser de nouvelles recherches. 

Même si l’exception a une portée limitée, elle peut quand même avoir une utilité non négligeable. Par exemple, elle va sécuriser la possibilité de faire du TDM à partir de contenus textuels librement accessibles en ligne, notamment des sites comme des archives ouvertes institutionnelles, HAL, Persée, Revues.org ou Hypothèses (ce qui était impossible avant, sauf pour les contenus places volontairement par les auteurs sous Creative Commons). Reste à favoriser au maximum le TDM à partir de ces sources, ce qui passe par la mise en place de moyens techniques (API, formats ouverts, etc) et devrait faire l’objet d’une politique concertée. 

Je précise pour terminer qu’un autre enjeu important se profile pour l’exception TDM à moyen terme : celui de l’adoption de la prochaine directive sur le droit d’auteur. Dans la proposition dévoilée par la Commission européenne en septembre dernier figure bien une exception en faveur du TDM, dont la transposition serait obligatoire pour tous les Etats-Membres. La formulation retenue présente le mérite par rapport à l’exception française de s’appliquer à tous les types d’oeuvres et de données. Elle couvre les activités de recherche scientifique, mais reste valable dans le cadre de partenariats impliquant des acteurs commerciaux. Par ailleurs, elle prévoit explicitement que les clauses contractuelles contraires seront inopérantes. En revanche, il persiste une marge de manoeuvre laissée aux titulaires de droits pour fixer des restrictions techniques aux opérations d’extraction, avec un appel aux Etats pour déterminer à leur niveau les bonnes pratiques en la matière.

Au final, il faut bien sûr se réjouir de l’adoption de cette exception dans la loi numérique, qui a été arrachée de haute lutte grâce à la mobilisation de la communauté des chercheurs et des professionnels de la documentation. Mais il serait naïf de croire que la partie est définitivement gagnée. Beaucoup de ce qui a été obtenu par la loi pourrait hélas être repris dans les décrets et cela reste au niveau européen que persiste l’enjeu décisif, car c’est la directive (dont l’adoption peut encore prendre deux ans) qui déterminera au final le cadre applicable.

Affaire à suivre…


Classé dans:Penser le droit d'auteur autrement ... Tagged: droit d'auteur, droit des bases de données, exceptions, exploration de données, fouille de données, loi numérique, TDM, text et data mining

Quel statut pour les données de la recherche après la loi numérique ?

jeudi 3 novembre 2016 à 14:31

Ce billet est le troisième d’une série que j’ai entamée au début de la semaine pour cerner les répercussions de la loi « République numérique » sur le secteur de l’Enseignement supérieur et de la Recherche. Après avoir commencé lundi à passer en revue le volet Open Access de la loi, je me suis penché sur la question de l’ouverture des données publiques et sur la manière dont les universités ont été intégrées dans le principe « d’Open Data par défaut » instauré par le texte. Cela concerne au premier chef les données administratives de ces établissements- celles produites par leurs services centraux et communs -, mais je terminais en posant la question de savoir dans quelle mesure les données de la recherche allaient être impactées (ou non) par ces nouvelles obligations de publication en Open Data.

data

C’est ce sujet que je vais traiter dans ce troisième billet, en élargissant la perspective pour essayer de montrer en quoi la loi « République numérique » a commencé à mettre en place un statut juridique spécifique pour les données de la recherche. Vous allez voir que les répercussions potentielles de la loi sont profondes en la matière, même si le texte contient quelques zones d’ombre qui rendent encore assez imprévisibles ses effets à long terme.

Par « données de la recherche » – notion complexe à définir -, je n’entendrai pas les données sur la recherche (qui cherche sur quoi ? avec quels financements ? etc.), qui relèvent des données administratives et donc du nouveau principe d’Open Data par défaut, mais les données résultant directement des activités de recherche, produites par les chercheurs.

L’ébauche d’un statut spécifique pour les données de recherche

Il faut faire une lecture combinée de plusieurs articles de la loi numérique pour apercevoir dans le texte l’ébauche d’un statut juridique des données de recherche. L’article 38 – celui qui consacre une nouvelle exception au droit d’auteur en faveur du Text et Data Mining – contient à ce propos une précision intéressante. Le texte aborde en effet la question de la conservation des fichiers qui sont produits dans le cadre de ce type d’activités de recherche et il prend la peine d’indiquer la chose suivante :

[…] ces fichiers constituent des données de la recherche.

Cette phrase peut paraître à première vue assez anodine, mais elle signifie en réalité que les « données de la recherche » vont à présent constituer une nouvelle catégorie juridique au sens propre du terme, avec des conséquences en terme de régime applicable. C’est un premier indice  qui nous montre que la loi a introduit un « statut » spécifique pour les données de la recherche, même si comme vous allez le voir, il faut produire un effort d’interprétation conséquent pour cerner exactement en quoi il consiste.

Une protection puissante contre la captation par les éditeurs

A l’article 30 de la loi numérique – celui consacré à l’Open Access -, on trouve les premiers éléments de réponse. C’est là que la loi consacre un nouveau « droit d’exploitation secondaire » au profit des chercheurs leur garantissant la possibilité d’auto-archiver leurs écrits, en dépit des clauses des contrats d’exclusivité qu’ils auraient pu signer avec des éditeurs, au terme d’un délai de 6 à 12 mois selon les disciplines.

 Mais le texte contient aussi un passage sur les données de la recherche, qui instaure un mécanisme de protection contre leur captation par les éditeurs scientifiques :

L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication.

Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.

Ce passage répond à une inquiétude grandissante dans les milieux académiques face aux pratiques des éditeurs vis-à-vis des données de recherche. Ces derniers – et notamment les plus puissants du secteur, type Elsevier ou Springer – ont commencé à inciter ces dernières années les chercheurs à publier non seulement le texte de leurs publications, mais aussi des matériaux complémentaires (complementary material), constitués en général par les jeux de données brutes ayant permis d’élaborer les résultats faisant l’objet de la publication. Grâce à leur position dominante, ces acteurs étaient donc en mesure d’emmagasiner peu à peu de grands volumes de données de recherche, soumises aux mêmes clauses d’exclusivité que les articles. Dès lors, le même phénomène de privatisation qui a frappé les écrits scientifiques était en train de se reproduire pour les données de recherche, avec à terme le risque pour les universités d’avoir à racheter aux éditeurs l’accès aux données que la communauté des chercheurs avaient produites.

Pour parer à ce danger, la loi numérique a prévu un mécanisme de protection assez similaire à celui du droit d’exploitation secondaire sur les écrits, même si on va voir qu’il est en réalité plus puissant dans ses effets. Le principe sera dorénavant que l’éditeur ne pourra plus « limiter la réutilisation des données de la recherche rendue publiques [accompagnant un écrit] dans le cadre de sa publication« . Cela signifie que, quand bien même des contrats contenant des clauses d’exclusivité seraient signés par les chercheurs, celles-ci seraient privées par la loi de toute validité. Plus encore, si l’éditeur rassemble ces informations fournies par les chercheurs dans une base de données, les Conditions Générales d’Utilisation (CGU) – qui ont une valeur contractuelle – ne pourront pas non plus empêcher la réutilisation des données de recherche. Elles doivent pouvoir en être librement extraites pour réutilisation. Sur ce dernier point, il faudra cependant attendre pour y voir plus clair les dispositions du décret d’application de l’article 38 de la loi sur le Text et Data Mining, qui doit déterminer les « conditions dans lesquelles l’exploration des textes et des données est mise en œuvre« .

On a donc ici un puissant mécanisme contre la captation à titre exclusif des données de la recherche par les éditeurs scientifiques, et on notera que par rapport au droit d’exploitation secondaire sur les écrits, ce dispositif de neutralisation des clauses contractuelles possède un effet immédiat. Il n’y a pas de durée d’embargo destinée à garantir une période d’exploitation commerciale exclusive pour l’éditeur. Les donnés de recherche sont en quelque sorte « immunisées » dès leur publication à toute tentative d’enclosure (pour employer un terme tiré de la théorie des Communs).

Puissante dans ses effets, cette disposition est cependant limitée dans son périmètre d’application. Notamment, elle n’est opposable qu’aux « éditeurs » d’un écrit scientifique auquel des données sont associées. Or on aurait aimé qu’elle puisse l’être également à des acteurs comme les réseaux sociaux numériques, type Academia ou Research Gate qui, déjà avides des données personnelles des chercheurs, pourraient très bien à terme aussi développer un appétit pour les données de la recherche. Et on sait aussi que certaines plateformes de diffusion des données de recherche sont contrôlées en réalité par des éditeurs (comme Figshare par exemple, qui est la propriété de Macmillian Publishers). Il aurait donc mieux valu que la protection conférée par l’article 30 soit formulée de manière plus générale pour être opposable à n’importe quel type d’acteurs, et pas uniquement aux éditeurs.

Mais moyennant ces réserves, on peut considérer que la loi numérique a posé des garde-fous précieux contre ce qui pourrait constituer dans les années à venir un grave problème pour l’écosystème de la recherche. Les éditeurs pourront tout à fait continuer à développer des activités autour des données de la recherche, mais ils devront fonder leurs modèles économiques sur de véritables services à valeur ajoutée. Ils ne pourront pas se contenter d’utiliser leur position dominante pour en revendre l’accès (à condition toutefois que se développe en parallèle une véritable politique publique d’infrastructures pour l’archivage et la diffusion des données scientifiques pour empêcher la constitution d’un monopole de fait. Mais c’est justement ce que la loi rend possible, en interdisant aux éditeurs de s’approprier en amont les données à titre exclusif).

Des données de recherche « libres » dès la publication

Pour revenir à l’article 30, on va voir à présent qu’il va créer une « condition juridique »originale pour les données de recherche et très différente de celle des articles scientifiques.

On sait en effet que les chercheurs constituent des agents publics qui ont la particularité de conserver pleinement leur droit d’auteur sur les œuvres qu’ils produisent dans le cadre de leurs fonctions (contrairement aux autres agents publics, dont les droits patrimoniaux sont exercés par leurs tutelles et dont le droit moral est réduit au droit à la paternité).

Une des conséquences secondaires de cette titularité individuelle des droits pour les chercheurs sur leurs écrits est que ceux-ci ne deviennent pas automatiquement réutilisables lorsqu’ils choisissent de les publier en ligne dans des archives ouvertes ou sur un site personnel. Le droit d’auteur qui s’applique à eux est pleinement maintenu lors de la diffusion sur Internet. C’est le cas par exemple pour un article déposé par un chercheur sur HAL ou dans une archive ouverte institutionnelle : par défaut, si le chercheur ne fait rien d’autre que le déposer, l’article sera librement accessible, mais pas librement réutilisable. Il ne le deviendra que si le chercheur choisit d’opter par un acte positif pour une licence Creative Commons (ce que la plate-forme HAL permet depuis le passage à la v3).

Cet état de fait justifie aux yeux de certains que l’on fasse une distinction entre « l’Accès ouvert »  et « l’Accès libre », les deux expressions renvoyant à deux réalités différentes. C’est notamment une précision que rappelle régulièrement Marin Dacos (et encore récemment dans la préface de la traduction d’un ouvrage de Peter Suber, dont voici un extrait)  :

Le terme open signifie « ouvert », et non « libre ». Il implique donc que le texte d’un article en open access est ouvert en lecture, sans barrière juridique, technique ou commerciale. Mais il ne dit rien des possibilités de réutilisation du document. Par conséquent, stricto sensu, l’open access lève les barrières à l’accès et maintient toutes les protections du droit d’auteur sur les textes, ce qui signifie qu’ils ne peuvent être reproduits ou modifiés qu’après une autorisation explicite, dans le cadre d’un contrat de cession de droit.

Or c’est précisément une distinction qui n’aura à présent plus de sens à propos des données de la recherche : des données publiées par un chercheur ou un établissement deviendront instantanément réutilisables librement, si bien que l’accès ouvert sera aussi synonyme d’accès libre.

C’est ce qui ressort notamment de ce passage de l’article 30 de la loi :

Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre.

« Leur réutilisation est libre ». La formule peut paraître lapidaire, mais elle n’en a pas moins d’importantes conséquences sur le plan juridique. Ces termes doivent être pris au sens de la lettre : la réutilisation est complètement libre, à toutes fins (y compris commerciales) et sans condition (pas même celle de citer la source). 

On peut en déduire (et c’est assez révolutionnaire) que la loi numérique va rendre inutile le recours aux licences libres pour la diffusion des données de la recherche. On sait que pour encadrer l’ouverture des données publiques en France, l’Etat a créé la Licence ouverte / Open Licence (qui permet la réutilisation des informations  à toutes fins, à condition d’en citer la source). D’autres licences, comme l’ODbL ou les licences Creative Commons, sont également utilisables en matière d’ouverture de bases de données. Or pour les données de recherche, de tels instruments sont à présent inutiles, car c’est la loi directement qui instaure à leur sujet un droit de libre réutilisation dès lors qu’elles sont publiées. 

On peut même aller plus loin en disant qu’il ne faut pas utiliser ces outils pour diffuser des données de recherche, car ces différentes licences comportent des conditions de réutilisation plus restrictives que le droit de libre réutilisation totale prévu par la loi. Or ces clauses (BY/NC/ND/SA) n’auront plus d’effet utile en raison du caractère d’ordre public des dispositions de l’article 30. La seule licence dorénavant compatible avec le régime légal des données de recherche est la CC0 

En cela, ce texte innove réellement, car c’est à ma connaissance un des seuls cas où la loi française va créer du « libre à l’état natif », sans avoir besoin de recourir à des licences pour opérer cette libération. Les dispositions de la loi se déclenchent automatiquement par l’acte de publication (et vous noterez d’ailleurs que le texte ne parle pas de publication « en ligne », mais simplement de publication, ce qui couvre des hypothèses plus larges, comme la diffusion via une base de données commerciale).

Quelles limites à la libre réutilisation ?

Néanmoins, il faut immédiatement préciser que l’article 30 a prévu de limiter son périmètre d’application, en excluant certains types de données de cet effet de « libération immédiate ». Il indique en effet que la réutilisation est libre , sauf si les données « sont protégées par un droit spécifique ou une réglementation particulière« .

Cette précision peut paraître à première vue assez sibylline, mais elle est en réalité parfaitement logique. On peut en effet penser à des données correspondant à des informations à caractère personnel, qui sont protégées par une « réglementation particulière ». Si c’est le cas, alors bien évidement, leur réutilisation ne sera pas libre, mais soumise à ce que prévoit la législation en la matière.

On peut aussi penser également au droit à l’image des personnes, qui constitue un « droit spécifique ». Celui-ci ne cédera pas du fait que des matériaux serait utilisés à des fins de recherche. Il est donc normal que le législateur ait prévu ces restrictions à la libre réutilisation des données de recherche, qui permettent de concilier des principes d’égale valeur.

Quid de l’articulation avec les droits de propriété intellectuelle ?

Mais la question devient plus épineuse si l’on entend par « droits spécifiques » des droits de propriété intellectuelle. Cela entre d’ailleurs manifestement dans l’intention du législateur, puisque ces droits sont visés dans l’exposé des motifs de la loi :

Le II spécifie que la réutilisation de données issues d’activité de recherche financées majoritairement sur des fonds publics est libre, dès lors que ces données ne sont pas protégées par un droit spécifique, comme par exemple un droit de propriété intellectuelle, et qu’elles ont été rendues publiques par le chercheur ou l’organisme de recherche.

Si par droit de propriété intellectuelle, on entend le droit d’auteur, alors les choses sont somme toute logiques encore, notamment afin de préserver les droits des tiers. Imaginons qu’un corpus de recherche contienne des documents protégés par des droits d’auteur (par exemple, un ensemble de textes littéraires). Si ce corpus est publié, alors bien entendu, il ne peut devenir ipso facto librement réutilisable. Pour être plus exact, il sera réutilisable dans une certaine mesure, sur le fondement de l’exception  Text et Data Mining prévue à l’article 38 de la loi, mais pas sur celui du droit de libre réutilisation des données de la recherche figurant à l’article 30.

Le vrai problème que pose l’articulation de cet article 30 avec les droits de propriété intellectuelle se situe en fait au niveau du droit des bases de données. Imaginons qu’un chercheur ou un établissement publie un jeu de données sur lequel porte un droit sui generis de producteur de base de données. On a alors bien affaire à un objet protégé par un « droit spécifique » et dans ce cas, ce jeu ne devrait pas devenir « librement réutilisable », si l’on s’en tient à la seule lecture de l’article 30.

Si l’on admet une telle interprétation,  la portée de ce droit de libre réutilisation des données de la recherche serait en réalité bien limitée, car dès lors que des jeux de données sont un peu conséquents, la protection du droit des bases de données leur sera sans doute applicable. Par ailleurs, l’application de l’article deviendrait aussi très incertaine, car le droit de producteur des bases de données est souvent aléatoire dans sa mise en œuvre. La jurisprudence est en effet  fluctuante sur la question et il n’est pas simple a priori de déterminer si telle ou telle base bénéficie ou non de la protection.

Mais vous allez voir l’obstacle à la libre réutilisation que pourrait constituer le droit des bases de données n’est en réalité pas insurmontable.

Qui est réellement titulaire des droits sur les données de recherche ?

Pour démêler cette question, il faut se demander à qui appartient réellement la propriété sur les données de recherche. Et le raisonnement à suivre pour répondre est là encore complètement différent de celui applicable aux articles.

En effet, pour les écrits scientifiques, les chercheurs sont incontestablement titulaires du droit d’auteur. Ce qui signifie que même si un chercheur produit des écrits sur son temps de travail et avec les moyens fournis par une université, il reste entièrement maître du droit sur ses créations, et c’est lui qui décide où et comment publier ses écrits.

Or pour les bases de données, les choses sont différentes. Même si ce sont les chercheurs qui produisent les données figurant dans ces bases, la titularité des droits peut – et même va dans la plupart des cas – leur échapper. En effet, le Code de propriété intellectuelle prévoit que la notion de producteur d’une base de données ne s’entend pas des personnes physiques qui collectent et traitent les informations, mais de la personne – physique ou morale – qui « prend l’initiative et le risque des investissements correspondants » et en retour « bénéficie d’une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d’un investissement financier, matériel ou humain substantiel« .

C’est donc vers le financeur et le fournisseur de moyens qu’il faut se tourner pour déterminer qui est titulaire des droits sur une base de données de la recherche. Dans la plupart des cas, ce seront donc les établissements auxquels les chercheurs sont rattachés qui bénéficieront de ces droits et non les chercheurs. Contrairement à ce qui prévaut pour les articles et autre écrits scientifiques, les bases de données appartiennent donc en principe aux institutions de recherche.

Sans doute faut-il nuancer quelque peu cette affirmation. Imaginons un chercheur qui publie un article dans une revue et qui lui adjoint un tableau de données brutes lui ayant servi à arriver aux résultats faisant l’objet de la publication. Dans ce cas, il est possible que le chercheur soit la personne qui a réalisé les « investissements » nécessaires –  sur ses propres forces – pour produire ces données. Mais quand bien même, il est fort improbable que de tels investissements individuels soient considérés comme « substantiels » au sens de la jurisprudence et ce tableau ne constituera vraisemblablement pas une base de données protégée. Donc il y a peu de chances qu’un chercheur isolé puisse être considéré comme un « producteur de base de données », au sens juridique du terme.

Imaginons à présent une base de données produite collaborativement et maintenue par les chercheurs d’un laboratoire ou une base de données développée spécifiquement dans le cadre d’un projet de recherche majoritairement financé par de l’argent public. Alors c’est l’employeur des chercheurs qui sera vraisemblablement titulaire des droits de producteur de base de données, car c’est lui qui assure les investissements nécessaires à la production de la base.

Or si c’est l’université qui est titulaire ab initio des droits sur une base de données scientifiques, cela aura d’importantes  conséquences du point de vue de la loi numérique. Pour le comprendre, il faut vous reporter au billet précédent que j’ai écrit sur l’Open Data et les universités, car vous allez voir que cette question rejoint en définitive celle des données de la recherche.

Le droit des bases de données des universités est neutralisé par défaut

En effet, l’article 11 de la loi numérique contient une disposition qui neutralise le droit des bases de données dont pourrait bénéficier les administrations soumises au principe d’Open Data par défaut (ce qui est le cas des universités) :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Donc on peut en déduire que si une université est titulaire d’un droit de producteur de base de données scientifiques, alors elle ne peut opposer ce droit à la réutilisation des informations qu’elle contient. Cela revient dès lors à dire que la réutilisation de ces données de recherche, nonobstant le droit de producteur de base de données, est bien « libre ».

Et nous rebouclons ici avec l’article 30 et son droit de libre réutilisation des données de recherche. De tout ce qui précède, nous pouvons conclure que l’article 30 nous dit bien que le droit de libre réutilisation des données de recherche ne vaut pas lorsque celles-ci sont protégées par un « droit spécifique », mais comme je viens de le montrer, cela ne peut concerner le droit de producteur de base de données qui, de toutes façons, est neutralisé en vertu de l’article 11 et ne peut être opposé à la libre réutilisation.

La conclusion est donc la suivante : des données de la recherche publiées par un chercheur ou un établissement seront donc bien librement réutilisables, sous réserve de respecter la législation sur les données personnelles ou le droit à l’image, ainsi que le droit d’auteur des tiers.

Reste alors une ultime question à considérer, car en définitive le seul moyen pour des chercheurs ou une institution d’empêcher la libre réutilisation de leurs données pourrait consister tout simplement à ne pas les publier. Mais vous allez voir qu’en réalité, ce choix-là n’existe pas non plus en vertu des dispositions combinées de la loi.

L’Open Data par défaut est applicable aux données de la recherche

Pour le comprendre, il faut revenir au principe d’Open Data par défaut que j’ai décrit dans le billet précédent. La loi numérique soumet dorénavant les administrations à l’obligation de publier de manière proactive et de rendre librement réutilisables un ensemble conséquent de documents et de données. C’est l’article 6 de la loi qui liste les informations concernées :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Comme vous le voyez, la loi impose la publication en ligne des « bases de données ». Cela signifie que si l’université est titulaire du droit de producteur de bases de données scientifiques développées en son sein (et nous avons vu dans la partie précédente que ce sera généralement le cas), alors elle devra les mettre en ligne en Open Data (à la seule réserve de la protection des données personnelles).

L’article précise aussi que les données présentant un intérêt « économique, sociétal, sanitaire ou environnemental » entrent dans le principe d’Open Data par défaut. Cela laisse une large marge d’interprétation  pour déterminer ce qui rentre dans ce périmètre. Mais une recherche serait bien insignifiante si les données qu’elle produit ne comportant pas a minima un intérêt « sociétal » et dans certains secteurs, ces informations revêtiront aussi un intérêt économique, environnemental ou sanitaire.

La conclusion de tout ceci – et je pense que les autorités de la recherche sont très loin de l’avoir suffisamment perçu -, c’est que la loi numérique va avoir des effets de levier très puissants sur la diffusion des données de la recherche en France. Là où les chercheurs ont gardé la faculté de décider s’ils publient ou non leur écrits en Open Access, ils l’ont manifestement perdue pour les données la recherche. Les universités dont ils dépendent ont à présent l’obligation de publier en ligne les données de la recherche produites en leur sein, et une fois publiées, ces données deviennent ipso facto librement réutilisables (sous la réserve – importante – de la protection des données personnelles et du respect des autres droits éventuels des tiers).

Dans l’hypothèse où les universités (ou les chercheurs) opposeraient une certaine inertie et ne respecteraient pas ces obligations de publication en Open Data, la loi n’a pas directement prévu de sanctions, mais il existera un mécanisme correctif assez facilement actionnable.

Le texte a en effet instauré un dispositif d’Open Data « à la demande » connecté au droit à la communication des documents administratifs. Si un individu, une association (ou même une entreprise) savent qu’un jeu de données de recherche existe, mais n’a pas encore fait l’objet d’une publication en Open Data, ils peuvent faire une demande de communication sur la base de la loi CADA. Si cette demande est fondée, l’université devra communiquer le document, mais aussi (s’il existe sous forme numérique), le mettre en ligne  et rendre librement réutilisables les informations qu’il contient dans un format ouvert lisible par les machines.

Au cas où les établissements de recherche n’agiraient pas d’eux-mêmes pour se conformer aux obligations de la loi, il existera donc un moyen de faire bouger les lignes par le biais de demandes de communication.

Conclusion : Données de la recherche et Communs de la connaissance

Pour conclure, je voudrais revenir sur la généalogie de la phrase « leur réutilisation est libre » figurant à l’article 30 de la loi numérique, qui joue un rôle central dans ce nouveau statut des données de la recherche créé par le texte.

A l’origine, le gouvernement avait l’ambition  d’introduire en droit français la notion de « domaine commun informationnel », en rattachant un certain  nombre d’informations et de données à la notion de « choses communes » issue de l’article 714 du Code civil :

Il est des choses qui n’appartiennent à personne et dont l’usage est commun à tous.

Il se trouve que les aléas politiques – et une bonne dose de lâcheté gouvernementale – ont entraîné l’abandon de l’article 8 de la loi qui manifestait cette ambition. Mais après la phase de consultation en ligne, le texte a été réécrit et ce sont les données de la recherche que le gouvernement a voulu qualifier de « choses communes » :

Les données de la recherche rendues publiques légalement issues d’une activité de recherche financée au moins pour moitié par des fonds publics et qui ne sont pas protégées par un droit spécifique sont des choses communes, au sens de l’article 714 du code civil.

Le Conseil d’Etat s’est alors prononcé sur cette version et il a émis un avis défavorable à propos de cette rédaction (au motif qu’aucune étude d’impact n’avait été réalisée sur ce point précis…).

L’argument était bien faible, mais il a suffi à ce que le texte du projet de la loi soit encore été remanié, avant l’introduction au Parlement, et c’est là qu’est apparue la rédaction qui y figure encore : « leur réutilisation est libre« .

Le rattachement explicite des données de la recherche aux choses communes a donc été gommé au fil des versions successives, mais si l’on y réfléchit bien, le résultat final est exactement le même du point de vue des conséquences juridiques que cela emporte.

Car en effet, on peut tout à fait dire à présent que les données de la recherche « n’appartiennent à personne » : elles n’appartiennent pas aux chercheurs, car ce sont les universités qui détiennent généralement le droit de producteur de base de données sur elles. Mais celui-ci est neutralisé par l’article 11 de la loi, qui impose par ailleurs la mise en ligne proactive. Donc concrètement, les données ne sont soumises à aucun droit de propriété efficace.

Et j’ai montré que l’article 30 avait pour conséquence qu’une fois les données de la recherche publiées, leur usage devient pleinement libre et donc « commun à tous » (sous réserve de la préoccupation légitime de protéger les données personnelles et les droits des tiers).

Par ailleurs, ces données sont non seulement rendues librement réutilisables par l’effet de la loi, mais aussi protégées contre les phénomènes d’enclosure, comme je l’ai montré dans la première partie du billet à propos des mécanismes de défense vis-à-vis de la captation par les éditeurs. La liberté d’usage donnée par la loi ne peut être reprise par quiconque.

Donc la conclusion à laquelle nous devons aboutir, c’est que la loi numérique a bien créé un statut juridique remarquable pour les données de la recherche : elle en a fait des Communs de la connaissance.

 


Classé dans:Données publiques et Open Data Tagged: données de la recherche, droit des bases de données, loi République numérique, open data, réutilisation, recherche, Universités

Les universités françaises et l’Open Data après la loi numérique

mardi 1 novembre 2016 à 18:35

Ce billet est le second d’une série de trois que je vais publier sur ce blog cette semaine pour examiner les répercussions de la loi « République numérique » sur le secteur de l’enseignement supérieur et de la recherche. Après un premier billet publié lundi à propos de l’impact de la loi en matière d’Open Access, je vais à présent me pencher sur le volet « Open Data » et la façon dont il va affecter les universités. Ce n’est pas l’aspect qui a été le plus commenté jusqu’à présent, mais vous allez voir que les changements à attendre pour ces établissements sont substantiels par rapport à la situation antérieure.

opendata
Image par Auregann. CC-BY-SA. Source : Wikimedia Commons.

Pour saisir complètement la portée de cette réforme, il faut prendre en considération, outre la loi « République numérique », la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi « loi Valter »), ainsi que son décret d’application paru en juillet dernier.

Je colle ci-dessous une présentation qui résume les grandes lignes de la question que je vais développer dans le billet par la suite.

Fin du régime dérogatoire des établissements d’enseignement supérieur et de recherche

Pour comprendre ce qui va changer pour les universités en matière d’ouverture des informations publiques qu’elles produisent, il faut remonter un peu en arrière et rappeler le cadre juridique qui leur était applicable avant l’entrée en vigueur de la loi numérique.

En 2005, la loi CADA (relative à l’accès aux documents administratifs) a été modifiée de manière à consacrer un principe de libre réutilisation des informations publiques des administrations. Néanmoins, la portée de cette règle était assez limitée, car si les administrations ne pouvaient en théorie refuser de faire droit à une demande de réutilisation de leurs données, elles n’étaient pas obligées de les mettre en ligne de manière pro-active et elles avaient aussi la possibilité de rendre la réutilisation payante par le biais de redevances.

A partir de 2011, un mouvement en faveur de l’Open Data a commencé à se dessiner en France, au niveau des administrations centrales, qui ont été obligées par le biais de décrets de mettre en ligne sur la plateforme data.gouv.fr un nombre croissant de jeux de données en les plaçant sous la Licence Ouverte / Open Licence (laquelle autorise la libre réutilisation y compris à des fins commerciales, à la condition de citer la source des données). Les ministères ont été les premières entités concernées par cette nouvelle politique et celui de l’Enseignement Supérieur et de la Recherche a publié à ce jour 55 jeux de données en Open Data.

Cependant les universités et les établissements de recherche sont restés de leur côté en dehors de ce mouvement d’Open Data, dans la mesure où ces administrations bénéficiaient d’un régime dérogatoire dans la loi CADA. Le texte comportait en effet un article 11 contenant les dispositions suivantes :

Par dérogation au présent chapitre, les conditions dans lesquelles les informations peuvent être utilisées sont fixées, le cas échéant, par les administrations […] lorsqu’elles figurent dans des documents produits ou reçus par :

a) des établissements et institutions d’enseignement et de recherche ;

b) des établissements, organismes ou services culturels.

Cet article signifiait que les établissements bénéficiaires (universités et institutions de recherche, mais aussi côté culture, bibliothèques, archives et musées) restaient libre de déterminer les conditions de réutilisation des informations qu’ils produisaient, et donc (pour simplifier) de ne pas autoriser les réutilisations. Cette forme de « privilège » a fait que ces administrations n’ont pas été concernées par les décrets de 2011 ayant initié la politique d’Open Data en France. Pour être exact, il ne leur était pas interdit d’ouvrir leurs données dans le cadre d’une politique d’Open Data, mais elles n’y étaient pas obligées et elles gardaient entièrement la faculté de déterminer quels jeux elles souhaitaient rendre librement réutilisables.

C’est précisément sur ce point que la loi « République numérique » va avoir un fort impact sur les universités, dans la mesure où le régime dérogatoire dont bénéficiaient les établissements d’enseignement supérieur et de recherche est supprimé. Ces derniers seront à présent intégrés au principe « d’Open Data par défaut » instauré par ce texte et qui en constitue une des principales innovations.

Les universités dorénavant incluses dans le principe « d’Open Data par défaut »

Pour comprendre en quoi consiste ce principe d’Open Data par défaut, il faut se reporter à l’article 6 de la loi « République numérique » :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Contrairement à la situation antérieure, les administrations (sauf quelques exceptions maintenues notamment par la loi Valter) sont désormais obligées de publier en ligne et de rendre réutilisables un large ensemble de jeux de données, dont l’article 6 définit plusieurs catégories. Et la nouveauté, c’est que les universités ne bénéficient plus à présent d’un régime dérogatoire qui leur permettraient de se soustraire à cette obligation d’ouverture des informations publiques. Celui a été en effet explicitement supprimé par la loi Valter en octobre 2015.

Parmi la liste figurant à l’article 6, on trouve notamment les « bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent […] ». Cela concerne notamment les bases de données composant le système d’information de l’administration centrale des universités, qui leur servent à gérer des aspects comme le budget, le personnel, leurs bâtiments et les flux associés, les formations dispensées ou les activités de recherche des laboratoires rattachés à l’établissement.

Le texte impose aussi (alinéa 2) la mise en ligne des documents listés dans un Répertoire des Informations Publiques (RIP), qu’en vertu de l’ancien article 17 de la loi CADA, toutes les administrations sont tenues de mettre en place. Le RIP consiste en un registre mis à disposition des usagers dans lequel figure la liste des « principaux documents » comportant les informations produites par l’établissement. A ma connaissance, aucune université française n’a encore rempli cette obligation légale de mise en place d’un RIP (ce qui pourrait leur être reproché), mais avec la loi numérique, elles seront aussi tenues de rendre réutilisables les documents qu’elles y feront figurer.

La loi numérique est plus floue lorsqu’elle évoque l’obligation de mise en ligne des « données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental« . Les universités garderont ici une marge de manoeuvre pour déterminer quelles informations parmi celles qu’elles produisent présentent un tel intérêt. Mais elles ne pourront cependant pas faire l’économie d’une démarche d’inventaire des jeux qu’elles détiennent et d’une sélection en vue d’une diffusion ouverte. L’idéal serait d’ailleurs que les universités se concertent entre elles pour libérer des jeux similaires.

A noter d’ailleurs qu’un mécanisme « d’Open Data à la demande » a été instauré par la loi république numérique, qui permettra assez facilement de forcer la mise en ligne de jeux de données au cas où une université ne procéderait pas d’elle-même à sa diffusion. L’alinéa 1 de l’article 6 indique en effet que les administrations doivent mettre en ligne « les documents qu’elles communiquent en application des procédures prévues au présent titre« . Cela signifie que les administrations seront obligées de mettre en ligne les documents qui leurs sont demandés par les usagers dans le cadre d’une procédure CADA d’accès aux documents administratifs. Si un document entre dans le périmètre (somme toute assez large) de cette loi, alors l’université ne pourra s’opposer à la communication (sous peine d’un recours à la CADA) et lorsque le document est communiqué, l’administration devra ensuite le mettre en ligne et rendre réutilisable les informations qu’il contient. Tout ceci fait que si une université fait preuve d’inertie dans la mise à disposition de données couvertes par l’article 6, il suffira qu’un citoyen, une association ou même une entreprise en fassent la demande auprès d’elle pour qu’elle soit obligée de les mettre en ligne.

On le voit ce principe « d’Open Data par défaut » est relativement puissant, et s’il n’est pas sans limite, il va sans doute produire des changements considérables dans la manière dont les universités diffusent les documents et les données qu’elles produisent.

Quelles limites à la réutilisation des données des universités ?

Le principe d’Open Data par défaut de la loi « République numérique » a beau être large, il n’est cependant pas sans limite. La première concerne l’impératif de protection des données personnelles et de la vie privée, qui devra naturellement continuer à être respecté et sur lequelle l’article 6 de la loi met l’accent :

Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents et les données mentionnés aux articles L. 312-1 ou L. 312-1-1 comportent des données à caractère personnel, ils ne peuvent être rendus publics qu’après avoir fait l’objet d’un traitement permettant de rendre impossible l’identification de ces personnes. Une liste des catégories de documents pouvant être rendus publics sans avoir fait l’objet du traitement susmentionné est fixée par décret pris après avis motivé et publié de la Commission nationale de l’informatique et des libertés.

Ce passage signifie que si des informations correspondent à des données à caractère personnel, alors les administrations ne doivent pas les mettre en ligne et les rendre réutilisables, à moins de rendre impossible l’identification des personnes concernées ou après avoir obtenu leur consentement. On notera qu’il ne suffit pas simplement d’anonymiser les données, mais de « rendre impossible l’identification des personnes« , ce qui va plus loin (notamment pour empêcher les identifications par recoupements de données).

Cet aspect risque d’être très compliqué à gérer pour les administrations en général et pour les universités en particulier. Car les établissements vont se retrouver pris entre deux exigences contradictoires : d’une part une soumission au principe d’Open Data par défaut, qui implique la publication de nombreux documents et jeux de données ; d’autre part l’impératif de protection des données personnelles qui reste toujours aussi fort. Pour prendre un exemple concret, une université sera dorénavant obligée de mettre en ligne les informations relatives au personnel qu’elle emploie ou aux étudiants inscrits, mais à la condition d’anonymiser ces données et de rendre impossible l’identification par recoupement, ce qui peut s’avérer très complexe à réaliser. La CNIL a annoncé qu’elle préparait un « pack de conformité » à destination des acteurs publics pour la mise en oeuvre de la loi République numérique et on attend à présent avec impatience ce document qui permettra sans doute d’y voir plus clair sur la manière de jongler avec ces exigences contradictoires.

Une autre limitation au principe d’Open Data par défaut concerne la protection des droits de propriété intellectuelle détenus par des tiers à l’administration. L’article L. 321-2 du Code des relations entre le public et les administrations prévoit ainsi que :

Ne sont pas considérées comme des informations publiques […] les informations contenues dans des documents […] sur lesquels des tiers détiennent des droits de propriété intellectuelle.

Dans le contexte d’établissements comme des universités, de nombreux documents couverts par des droits de propriété intellectuelle sont produits, que l’on songe par exemple aux cours et aux publications des enseignants-chercheurs, aux diverses productions des étudiants (copies d’examen, travaux, mémoires, etc), aux ressources pédagogiques à distance, etc. Tous ces contenus sont naturellement exclus du périmètre des documents soumis à l’obligation de mise en ligne définie à l’article 6 de la loi. Pour ce qui concerne le cas spécifique des publications des chercheurs, il est traité à l’article 30 de la loi, à travers les dispositions de faveur de l’Open Access dont j’ai parlé dans un précédent billet, mais le principe demeure que les chercheurs restent pleinement titulaires du droit d’auteur sur leurs productions et sont à ce titre libres de décider s’ils souhaitent les publier en ligne ou non.

A propos de cette question de l’articulation entre l’Open Data et les droits de propriété intellectuelle, il faut noter que la loi « République numérique » a cependant apporté une clarification importante relative au droit des bases de données des administrations. Il était arrivé dans le passé que des administrations (notamment des services d’archives) opposent leur droit de producteur de base de données à une demande de réutilisation. Après quelques flottements, la jurisprudence administrative avait fini par leur donner raison, ce qui signifiait que ces établissements pouvaient neutraliser le principe de libre réutilisation des informations publiques en s’appuyant sur le droit des bases de données. Or la loi numérique contient un article 11 qui va complètement changer la donne en la matière :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cette phrase signifie que les administrations ne peuvent dorénavant plus opposer un droit de producteur de base de données à une demande de réutilisation des informations publiques qu’elles détiennent, et cela s’appliquera aux universités comme aux autres.

Quid de la faculté à fixer des redevances de réutilisation ?

Contrairement à la situation qui prévalait antérieurement dans laquelle les administrations pouvaient discrétionnairement mettre en place des redevances pour la réutilisation de leurs données, la loi Valter a consacré un principe général de gratuité. L’article 15 de la loi prévoit néanmoins une dérogation possible à titre exceptionnel pour les administrations dont le financement est substantiellement assuré par des ressources propres :

La réutilisation d’informations publiques est gratuite. Toutefois, les administrations mentionnées à l’article 1er peuvent établir une redevance de réutilisation lorsqu’elles sont tenues de couvrir par des recettes propres une part substantielle des coûts liés à l’accomplissement de leurs missions de service public.

Un doute pourrait poindre ici à propos des universités, car il s’agit typiquement d’établissements auxquels il est demandé de dégager des ressources propres pour assurer une part d’auto-financement. Néanmoins, le décret d’application de la loi Valter, paru en juillet dernier, a clairement défini un seuil minimal de 25% de ressources propres en dessous duquel les administrations ne sont plus autorisées à exiger des redevances de réutilisation :

Sont seuls autorisés à établir des redevances de réutilisation en application de l’article L. 324-1 les services de l’Etat et les autres personnes mentionnées à l’article L. 300-2 dont l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques, lorsque la couverture des coûts liés à cette activité principale est assurée à moins de 75 % par des recettes fiscales, des dotations ou des subventions.

Or si l’on en croit ces chiffres tirés de l’Observatoire KPMG 2015 des Universités et des Ecoles, les universités en France dégagent en moyenne 18% de ressources propres, ce qui les placent en dessous du seuil fixé par le décret de la loi Valter.

ressources

Ceci étant dit, on pourrait imaginer qu’une université arrive à dépasser ce seuil des 25% et l’étude KPMG précité indique que les Ecoles et Instituts de recherche atteignent en moyenne plutôt des taux d’autofinancement de 32%. Néanmoins, cela ne permettra toujours pas à ces établissements de recherche de lever des redevances de réutilisation sur la réutilisation de leurs données.

Car le décret de la loi Valter précise bien que seuls disposent de cette faculté les administrations dont « l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques » et il faut par ailleurs que les subventions qui leur sont versées servent directement à couvrir les coûts de cette activité principale liée aux données. Or ce n’est pas le cas des universités et établissements de recherche, dont les missions sont bien plus larges que la seule production d’informations publiques.

On en déduit donc que les universités sont strictement astreintes au respect du principe de gratuité et qu’elles ne pourront plus établir de redevances de réutilisation des données, sous peine de se mettre dans l’illégalité.

Conclusion : les universités françaises doivent à présent passer à l’Open Data

On le voit, la loi « République numérique » va avoir un impact important sur les universités en les soumettant, comme les autres administrations au principe d’Open Data par défaut qu’elle instaure. C’est la fin d’une situation dérogatoire qui s’appliquait aux universités et établissements de recherche dans la législation antérieure. Cela signifie qu’un grand nombre de documents et de jeux de données devront être mis en ligne dans les années à venir par les universités, ce qui implique des défis organisationnels non négligeables à surmonter. Il me semble d’ailleurs que les conséquences de ce texte n’ont pas été assez clairement perçus par ces acteurs, qui se sont beaucoup focalisés sur le volet Open Access de la loi sans voir que la partie Open Data les concernait également.

La loi fixe aux administrations plusieurs délais (de 6 mois à deux ans selon les catégories de données) pour se conformer à ces nouvelles obligations, échéances qui vont arriver très rapidement à présent. Il faut cependant noter qu’un décret est encore attendu qui va fixer un seuil d’agents au-delà duquel une administration sera soumise au principe d’Open Data par défaut. Mais les universités étant généralement des établissements employant un nombre conséquent d’employés, il serait surprenant qu’elles ne soient pas comprises dans les administrations concernées.

Dans ce billet, j’ai surtout insisté sur les données produites par les universités en tant qu’établissement administratif. Ce sont les informations produites par les services centraux et les services communs de ces établissements qui sont au premier chef concernées par le passage en Open Data (y compris d’ailleurs celles des Services Communs de la Documentation, c’est-à-dire les bibliothèques universitaires). Néanmoins, une autre question importante est de savoir si les données de la recherche, en tant que telles, sont comprises ou non dans ce principe d’Open Data par défaut. Au cas où la réponse serait positive, cela signifie qu’il y aurait également obligation de les mettre en ligne et de les rendre réutilisables, moyennant la protection des données personnelles.

C’est une interrogation à laquelle j’essaierai de répondre dans le troisième billet de cette série consacrée aux répercussions de la loi numérique sur le secteur de l’enseignement supérieur et de la recherche. J’y étudierai la manière dont le texte met en place un nouveau « statut » des données de la recherche.

En attendant, les commentaires sont ouverts si vous souhaitez poser des questions ou laisser des observations à propos de ce nouveau tournant de l’Open Data qui attend les universités.


Classé dans:Données publiques et Open Data Tagged: données personnelles, informations publiques, open data, réutilisation, recherche, Universités

Open Access : quelles incidences de la loi « République numérique » ?

lundi 31 octobre 2016 à 00:14

La semaine dernière, on célébrait l’Open Access Week et j’ai eu l’occasion de donner plusieurs interventions à propos des incidences de la loi « République numérique » sur le Libre Accès aux publications scientifiques. On sait en effet que la Loi Lemaire, qui est entrée en vigueur le 8 octobre dernier, a consacré un nouveau « droit d’exploitation secondaire » au profit des chercheurs, afin de faciliter notamment le dépôt en archives ouvertes de leurs publications. Mais l’article (30) qui contient ces nouvelles dispositions n’est pas de lecture facile et il contient même plusieurs points assez délicats à interpréter. J’ai reçu ces dernières semaines de nombreuses questions de collègues qui cherchaient à avoir des précisions ou à lever des ambiguïtés, et j’ai profité des interventions à l’Open Access Week pour essayer d’apporter quelques clarifications.

open-access

De manière à ce que cela puisse profiter au plus grand nombre, je publie mon support d’intervention ci-dessous. Par ailleurs, je vais détailler certains des points abordés à travers une FAQ, de manière à mieux faire le tour de la question de manière aussi complète que possible. Si jamais vous avez besoin d’un éclaircissement complémentaire ou si une question ne vous paraît pas traitée, n’hésitez pas à le faire savoir dans les commentaires et j’en profiterai pour compléter ce billet.

Je vais suivre un canevas simple (Qui ? Quoi ? Quand ? Où ?) dans cette FAQ pour aborder les différentes dimensions du nouveau « droit d’exploitation secondaire » consacré par la loi République numérique : Qui peut déposer ? Quels types de publication sont couvertes par le texte ? Quand le dépôt est-il possible ? Où peut-on déposer ?

A noter que sur certains points, je ne serai pas en mesure d’apporter une réponse définitive, car les ambiguïtés du texte de loi sont telles que seule une juridiction  saisie dans le cadre d’un litige serait en mesure de les lever. Ce qui risque de soulever d’épineuses difficultés pratiques, car il est assez improbable qu’un tel procès ait lieu…

Ce billet sera le premier d’une série de trois que je vais consacrer aux incidences de la loi « République numérique » sur l’Enseignement Supérieur et la Recherche. Le second portera sur la manière dont les universités seront impactées par le principe d’Open Data par défaut consacré par la loi Lemaire et le troisième se penchera sur les données de la recherche et sur le nouveau statut juridique que la loi va leur conférer.

Loi « République numérique » et Open Acces : une FAQ

Pour mémoire, je recopie ci-dessous le texte de l’article 30 de la loi, relatif à la question des publications scientifiques :

Lorsqu’un écrit scientifique issu d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne est publié dans un périodique paraissant au moins une fois par an, son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur, du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l’accord des éventuels coauteurs, la version finale de son manuscrit acceptée pour publication, dès lors que l’éditeur met lui-même celle-ci gratuitement à disposition par voie numérique ou, à défaut, à l’expiration d’un délai courant à compter de la date de la première publication. Ce délai est au maximum de six mois pour une publication dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et sociales.

La version mise à disposition en application du premier alinéa ne peut faire l’objet d’une exploitation dans le cadre d’une activité d’édition à caractère commercial.

[…] Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.

A) Qui peut déposer ?

  1. A quoi correspond une « activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne » ? 

On comprend ici qu’il s’agit des activités de recherche financées au moins à 50% par de l’argent public, notamment lorsqu’il s’agit de projets ponctuels, du type de ceux qui reçoivent le soutien financier de l’ANR, d’un Labex ou du programme H2020 de l’Union européenne.

On peut néanmoins se poser la question de savoir si les publications produites par les chercheurs en dehors d’un projet ponctuel, c’est-à-dire sans doute la majorité d’entre elles, sont couvertes par l’article 30. Dans ce cas-là, on peut considérer que c’est le salaire des chercheurs, et donc bien de l’argent public, qui finance ce type de recherches.

L’interprétation la plus vraisemblable est donc que ces publications issues de l’activité courante des chercheurs (hors projets) sont bien comprises dans le champ d’application de la loi, même s’il eut été préférable que le texte soit plus explicite sur ce point.

Déterminer si une recherche est effectuée sur fonds publics n’est pas toujours simple. On m’a demandé par exemple ce qu’il en était des travaux produits dans le cadre d’une convention CIFRE (dispositif d’accueil de doctorants par des entreprises) et la réponse me paraît en l’état difficile à donner…

2. Que se passe-t-il si le chercheur est rémunéré par l’éditeur ? 

Cette hypothèse est rare, la règle voulant dans la plupart des disciplines que les chercheurs ne sont pas rémunérés pour les articles qu’ils publient dans les revues scientifiques. Mais il existe quelques exceptions, selon les politiques des éditeurs, ainsi que dans certaines disciplines (comme le droit notamment).

Dans ce cas où le chercheur est rémunéré par l’éditeur, on ne peut sans doute plus considérer que la recherche est financée par de l’argent public. On revient en effet dans un cadre classique de cession des droits contre rémunération. Du coup, le droit d’exploitation secondaire consacré par la loi ne peut alors vraisemblablement pas être opposé à l’éditer, si le chercheur lui consent une cession exclusive par le biais d’un contrat d’édition.

Il faut cependant noter que les chercheurs sont généralement payés au forfait pour des publications de type articles. A partir de quel seuil de rémunération peut-on considérer que la loi est neutralisée ? C’est difficile à dire, mais il ne serait pas logique qu’il suffise à un éditeur de verser par exemple un euro symbolique pour priver le droit d’exploitation secondaire de ses effets…

3) Les chercheurs seront-ils obligés de déposer leurs publications en Open Access lorsqu’elles sont comprises dans le champ d’application de la loi ?

La loi précise que « l’auteur dispose du droit de mettre à disposition gratuitement » sa publication. Cette formulation sous-entend que le droit d’exploitation secondaire constitue une simple faculté ouverte au bénéfice du chercheur et non une obligation.

Il appartiendra donc à chaque chercheur dont une publication est comprise dans le champ d’application de la loi de décider s’il souhaite d’opter ou non pour le Libre Accès. C’est un des points essentiels de l’équilibre de cette loi qu’il faut souligner et qui va rendre encore nécessaire l’effort de pédagogie autour de l’Open Access.

A noter cependant que si la loi n’impose pas d’obligation, il est possible que les chercheurs soient soumis à des dispositifs plus contraignants par d’autres biais. Il peut notamment s’agir de la mise en place de politique institutionnelle imposant qu’un chercheur rattaché à un établissement publie en Open Access (comme c’est le cas à l’INRIA), de l’adoption d’un mandat de dépôt obligatoire (comme à l’université d’Angers), de politiques de dépôt établies au niveau d’un laboratoire de recherche ou de la contrepartie imposée par un organisme de financement de la recherche (comme c’est le cas dans le cadre du programme européen H2020).

B) Quels types de publications peut-on déposer ?

  1. Que doit-on entendre par « écrit scientifique publié dans un périodique publié au moins une fois par an » ? 

Cette expression couvre les publications de type articles, recensions, communications, compte-rendus, interventions, commentaires, etc. dès lors qu’elles paraissent dans un journal ou une revue ayant un rythme de parution au moins annuel.

A noter cependant que le texte précise qu’il doit s’agir d' »écrits scientifiques », ce qui peut exclure des publications de type articles dans la presse d’information générale. Une zone grise risque d’ailleurs de se former à propos des travaux de vulgarisation pour déterminer jusqu’à quel point ils constituent des « écrits scientifiques ».

On m’a aussi demandé à propos du rythme de parution ce qu’il en était pour des revues purement numériques, qui constituent davantage des bases de données que des périodiques et qui n’ont plus vraiment de périodicité régulière, les articles étant publiés au fil de l’eau. A mon sens, on peut considérer qu’il s’agit tout de même de « périodiques » d’un point de vue bibliographique et on pourra dans le doute vérifier si un ISSN leur a été attribué.

En revanche, la formulation retenue dans la loi exclut les ouvrages de type monographies, ainsi que les contributions à des ouvrages collectifs. Pour ce type de publications, les cessions de droits exclusives continueront à prévaloir si elles sont consenties par les chercheurs, sachant en plus que les éditeurs rémunèrent souvent les auteurs de monographies, ce qui bloque le droit d’exploitation secondaire comme on l’a vu plus haut.

A noter que la version initiale de l’article de loi faisait aussi référence aux « actes de congrès ou colloques ou recueils de mélanges » sans mentionner de périodicité particulière. Mais ce type de publications a été retiré de l’article au cours de la discussion parlementaire. Cela ne signifie cependant pas que le droit d’exploitation secondaire ne pourra pas jouer pour des actes de colloques ou des recueils de mélanges, mais il faudra regarder quel type de publication en est le véhicule. Si ces écrits sont publiés dans une publication périodique paraissant au moins une fois par an, le chercheur conservera le droit de publier en Open Access, mais pas s’ils sont publiés dans des monographies.

2) Quelle version d’une publication est couverte par la loi ? 

Le texte précise que l’auteur a le droit de déposer en libre accès « la version finale de son manuscrit accepté pour publication« . Cela signifie que le droit d’exploitation secondaire s’applique non pas seulement au manuscrit initial soumis par le chercheur à l’éditeur, mais aussi à la version comportant les révisions intégrées suite au processus d’évaluation par un comité de lecture (peer-reviewing). L’expression « version finale acceptée pour publication » renvoie en fait à la version validée par l’auteur avec le bon-à-tirer (BAT), qui donne le feu vert à la dernière phase du processus d’édition.

Par contre, la version finale de l’article, c’est-à-dire celle comportant le texte de l’auteur inséré dans la maquette de la revue, avec la mise en page opérée par l’éditeur et l’application de la pagination, n’est pas couverte par le texte de loi. Cette version, qui correspond au « pdf éditeur » envoyé généralement à l’auteur continue à faire l’objet d’un droit exclusif appartenant à l’éditeur et ne pourra pas être déposée en libre accès par le chercheur.

Il faut  noter cependant qu’un certain nombre de revues ont déclaré des politiques d’Open Access autorisant la mise en ligne du « pdf éditeur » par le chercheur et cette lattitude continuera bien sûr à prévaloir suite à l’entrée en vigueur de la loi.

3) Qu’en est-il des corrections sur épreuve ? 

On m’a fait remarquer que si la loi s’applique à la dernière version certifiée par le bon-à-tirer délivré par le chercheur, ce dernier ne dispose généralement pas du fichier final comportant les corrections sur épreuve renvoyées à l’éditeur à cette occasion. La version définitive du texte de l’article incorporant ces dernières corrections ne lui revient souvent que sous la forme du pdf éditeur, que la loi ne lui permet pas de déposer en libre accès.

Cela peut poser problème dans la mesure où le chercheur se verra alors contraint de déposer une version de son article qui ne correspondra pas tout à fait à la version définitive. Une manière pour les chercheurs de surmonter cette difficulté pourrait être de demander à l’éditeur de leur transmettre un fichier sans la mise en page finale ou bien d’extraire du pdf éditeur le texte brut pour pouvoir ensuite procéder à la publication en Open Access.

Mais on peut s’attendre à ce que peu de chercheurs entreprennent de telles démarches.

4) Les illustrations accompagnant les articles sont-elles couvertes elles-aussi par la loi ?

A priori, ce n’est pas le cas, car l’article précise bien qu’il n’est applicable qu’aux « écrits scientifiques« , ce qui semble ne renvoyer qu’au texte des publications et pas aux éventuelles illustrations qui les accompagnent (photographies, schémas, graphiques, etc.).

En réalité, deux cas de figure distincts peuvent se présenter à propos des illustrations. Soit l’auteur de l’article est aussi auteur des illustrations (il a pris lui-même les photos ou réalisé les schémas et graphiques). Dans ce cas, étant titulaire des droits sur ces éléments, il sera en mesure de les faire figurer dans la version qu’il diffusera en Open Access et le droit d’exploitation secondaire prévu par la loi sera bien opposable à l’éditeur. Soit les illustrations seront couvertes par des droits appartenant à des tiers : dans ce cas, l’auteur est généralement obligé de négocier des autorisations (et éventuellement de payer une redevance) pour la publication dans la revue scientifique. Mais cette autorisation sera souvent étroitement limitée à cette première publication dans la revue et elle ne s’étendra pas ipso facto à la diffusion en libre accès. Dans cette hypothèse, la loi République numérique ne sera d’aucun secours au chercheur et il lui appartiendra d’aller négocier une nouvelle autorisation pour le dépôt en Open Access (ce qui sera généralement complexe et parfois même impossible).

A noter que si les images réutilisées pour illustrer l’article sont dans le domaine public ou sous licence Creative Commons, alors il n’y a pas d’obstacle à ce qu’elles accompagnent aussi la diffusion en Libre Accès.

5) Le droit d’exploitation secondaire peut-il être opposé à des éditeurs étrangers ? 

C’est une question qui revient souvent et elle est en effet épineuse : les dispositions de la loi République numérique relative à l’Open Access seront-elles opposables aux éditeurs étrangers ou seulement à leurs homologues français ? Il est fréquent que les éditeurs étrangers fassent signer aux chercheurs des contrats d’édition soumis à la loi de leur pays d’origine (notamment américaine). Dans ce cas, la loi française se trouve-t-elle neutralisée, ce qui reviendrait à en limiter sévèrement la portée ?

A vrai dire, le Conseil d’Etat a jeté un doute sévère sur cette question de l’application territoriale du texte dans l’avis qu’il a rendu sur la loi République numérique. Il y dit notamment ceci :

En ce qui concerne la mise à disposition gratuite sur l’internet des résultats de recherches financées sur fonds publics […], le Conseil d’État a relevé que l’impact d’une telle mesure sur les contrats futurs entre éditeurs et auteurs tenait à son caractère d’ordre public, lequel ne peut jouer que sur le territoire français, alors que l’effet de la diffusion sur l’internet est mondial. Cette incohérence lui a paru faire obstacle à l’adoption de cette mesure.

Néanmoins, on voit assez mal en quoi le caractère d’ordre public des dispositions de la loi République numérique ferait obstacle à leur applicabilité aux contrats signés avec des éditeurs étrangers. On a vu en effet récemment des cas où une juridiction française a reconnu qu’une règle d’ordre public pouvait prévaloir sur les Conditions Générales d’Utilisation d’un service en ligne (dont la nature est contractuelle). Ce fut le cas notamment en février dernier dans le cadre de l’affaire opposant un citoyen français à Facebook à propos du retrait d’une publication du tableau « L’Origine du Monde » de Courbet, jugé contraire aux conditions d’utilisation du service. La Cour d’appel de Paris a estimé à cette occasion qu’était abusive la clause prévoyant que les litiges entre Facebook et ses utilisateurs ne pouvaient être jugés que par les tribunaux du Comté de Santa Clara en Californie. Les CGU de la plateforme ont été écartées au profit de l’application de la règle de principe figurant dans le Code de la Consommation.

Or on est dans un cas tout à fait comparable avec les contrats d’édition signés par les chercheurs avec des éditeurs étrangers. La loi République numérique précise explicitement que « Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite« . On ne voit donc pas au nom de quoi le même raisonnement que celui-ci tenu dans l’affaire Facebook mentionnée ci-dessus ne pourrait pas être tenu.

Contrairement à ce qu’a pu laisser entendre le Conseil d’Etat, il est donc vraisemblable de penser que la loi numérique sera bien opposable aux éditeurs étrangers.

C) Quand les chercheurs pourront-il déposer en Libre Accès ?

  1. Quels sont les délais d’embargo qui vont rester applicables ?  

Le texte précise que les chercheurs pourront diffuser leurs publications en Libre Accès moyennant l’observation d’un « délai maximum de 6 mois dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et sociales« , à compter de la date de la première publication par l’éditeur.

On m’a demandé si une matière comme le droit par exemple était couverte par l’article, étant donné qu’elle ne figure pas explicitement dans le texte. On peut considérer que l’intention du législateur a été de couvrir toutes les disciplines et donc qu’une matière est forcément couverte soit par un délai de 6 mois, soit par un délai de 12 mois. Pour le droit, on considérera donc qu’il relève des sciences humaines et sociales, ce qui est le plus logique.

Par ailleurs, on m’a aussi demandé ce qui se passait lorsqu’un chercheur en sociologie publiait un article dans une revue de physique… Dans ce cas, on peut estimer que la philosophie générale de la loi a plutôt l’air de fonctionner en prenant en considération le véhicule du texte plutôt que sa discipline intrinsèque. Pour un chercheur en sociologie qui publierais dans une revue de physique, on pourra donc retenir la durée de 6 mois applicable aux sciences et techniques.

Pour des revues qui seraient vraiment pluridisciplinaires ou transdisciplinaires, l’interprétation sera plus complexe, mais ces hypothèses seront sans doute assez rares.

2. Faudra-t-il attendre des décrets d’application pour que la loi devienne applicable ?

Non. L’adoption de décrets va en effet être nécessaire pour d’autres parties de la loi République numérique (notamment celle relatives à l’Open Data et à l’exception en faveur du Text et Data Mining).

Néanmoins, l’article 30 ne mentionne nullement la nécessité d’adopter des décrets et il sera donc directement applicable à la date d’entrée en vigueur de la loi (c’est-à-dire le 9 octobre 2016).

3. La loi République numérique a-t-elle un effet rétroactif ? 

Cette question est sans doute l’une des plus épineuse que l’on m’ait posées, mais elle revêt pourtant une importance cruciale, étant donné que selon le sens de la réponse apportée, le champ d’application du texte variera grandement.

Si cette loi n’a pas d’effet rétroactif, elle ne s’appliquera qu’aux contrats d’édition signés après sa date d’entrée en vigueur (soit le 9 octobre 2016, jour qui suit sa parution au JO). Cela signifie que pour tous les articles publiés auparavant, les délais d’embargo imposés par les éditeurs, qui peuvent être largement supérieurs à ceux prévus par le texte, continueraient à s’appliquer. On aurait donc une loi qui ne commencerait réellement à produire des effets que dans 6 mois pour les sciences exactes et dans un an pour les SHS. Si au contraire, on estime que le texte a un effet rétroactif, alors les chercheurs seraient immédiatement déliés des anciennes durées d’embargo et la loi concernait un volume de publications beaucoup plus important, incluant le stock des articles rétrospectifs.

A vrai dire, cette question de la rétroactivité du texte peut paraître surprenante, étant donné que le fameux article 2 du Code civil énonce le principe suivant :

La loi ne dispose que pour l’avenir ; elle n’a point d’effet rétroactif.

Néanmoins, et contrairement à une idée reçue, cela ne signifie pas qu’une loi ne puisse pas avoir d’effets rétroactifs. Le Conseil Constitutionnel n’a en effet donné une portée absolue au principe de non-rétractivité des lois qu’en matière pénale. Et le législateur peut parfaitement déroger à ce principe général par une loi spéciale en prévoyant qu’elle aura des effets dans le passé (voir ici pour une synthèse de la question).

Il existe donc des textes de lois dotés d’une portée rétroactive, mais en général, ils le prévoient explicitement. Or c’est ici que le bât blesse avec la loi numérique, car le texte ne nous dit pas explicitement qu’il s’applique aux contrats antérieurs. Il se contente de préciser que les dispositions de l’article 30 ont un caractère d’ordre public et que « toute clause contraire à celles-ci est réputée non écrite ».

Mais si l’on regarde attentivement la première version du texte soumise à la consultation en ligne par le gouvernement, on constate que la formulation initiale de ce passage était différente :

Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite. Elles ne s’appliquent pas aux contrats en cours.

Le fait est que la dernière phrase a été supprimée lors du débat parlementaire, ce qui pourrait constituer un indice de la volonté du législateur de donner une portée rétroactive à ces dispositions.

Au final, il n’est pas facile d’apporter une réponse à cette question de la rétroactivité. Certes, la suppression de cette dernière phrase est un argument sérieux à prendre en compte. Mais dans le doute, ce serait aux tribunaux de décider en dernier ressort si la loi a un effet rétroactif ou non. Or généralement, ils ne vont pas dans ce sens lorsque le texte n’est pas explicite, sans compter qu’il y a ici des droits acquis par les éditeurs à protéger, au nom du principe de sécurité juridique. Le problème, c’est qu’il est hautement improbable que nous n’ayons jamais une décision de justice à ce sujet, car cela supposerait qu’un éditeur scientifique fasse un procès à un chercheur qui aurait déposé en Open Access un article, ce qui paraît assez improbable vu les dégâts en terme d’image que cela occasionnerait pour lui.

Du coup, on risque de rester longtemps avec une ambiguïté gênante dans le texte. Un commencement de solution pour lever ce problème pourrait consister à faire poser une question parlementaire par un député ou un sénateur au Ministre de la Recherche, de manière à ce qu’il puisse donner son interprétation. Celle-ci n’aurait pas une valeur absolue (car seule l’appréciation des juges en a une), mais elle pourrait nous donner une indication.

A défaut, il est bon de rappeler que les chercheurs qui n’auraient jamais signé de contrat d’édition en bonne et due forme avec l’éditeur (hypothèse assez fréquente dans certaines disciplines) gardent un droit plein et entier à déposer leurs publications en Open Access, y compris sans tenir compte des durées d’embargo qui pourraient avoir été déclarées par l’éditeur.

4. Que doit-on entendre lorsque la loi dit « dès lors que l’éditeur met lui-même celle-ci gratuitement à disposition par voie numérique » ? 

Les délais de 6 mois et 12 mois prévus par le texte ne s’appliquent que si l’éditeur n’a pas mis auparavant de son propre chef en libre accès les publications. Imaginons par exemple qu’un éditeur en SHS mette en ligne un article 6 mois après la première publication, alors l’auteur bénéfice immédiatement de son droit d’exploitation secondaire pour réaliser un auto-archivage du texte sans avoir à attendre que les 12 mois prévus par la loi soient écoulés.

On peut donc en déduire que cette règle vaudra aussi pour tous les articles publiés dans des revues en Gold Open Access (c’est-à-dire immédiatement disponibles gratuitement en ligne). Si l’on prend le cas par exemple d’une revue figurant sur le portail Revues.org et n’appliquant aucun embargo, les auteurs pourront republier immédiatement leurs textes dans une archive ouverte ou sur un site personnel.

Par ailleurs, il est utile de rappeler que les délais de 6 mois et 12 mois prévus par la loi sont explicitement qualifiés de « délais maximum ». Cela signifie que la loi n’aura pas pour effet d’imposer de telle durée d’embargo à toutes les revues : les éditeurs gardent la faculté de mettre en place des délais moins longs. Ce ne sont que les délais supérieurs qui seront à présent sans effet vis-à-vis du droit d’exploitation secondaire reconnu aux chercheurs par la loi.

D) Où les dépôts pourront être effectués ?

  1. Quelles sont les formes de publication autorisées par la loi ? 

L’article 30 prévoit qu’est autorisée « la mise à disposition gratuitement dans un format ouvert, par voie numérique ». Cette formulation est suffisamment large pour recouvrir un grand nombre d’hypothèses, comme la publication dans une archive ouverte, qu’elle soit internationale (comme ArXiv), nationale (comme HAL) ou institutionnelle. Par ailleurs, le chercheur pourra aussi procéder à un auto-archivage de son texte sur une page web du site de son laboratoire ou sur un site personnel (toutes ces hypothèses pouvant d’ailleurs se cumuler).

Cependant, la loi fixe une limite en précisant que la version mise à disposition par le chercheur en vertu de son droit d’exploitation secondaire ne peut « faire l’objet d’une exploitation dans le cadre d’une activité d’édition à caractère commercial ». On peut donc en déduire que le chercheur ne peut pas aller proposer le même texte soumis à un premier éditeur à l’un de ses concurrents, de manière à préserver l’exclusivité qui lui avait été initialement conférée.

2. Les réseaux sociaux scientifiques sont-ils couverts par la loi numérique ? 

Des réseaux comme Academia.edu, Research Gate ou My Science Work sont-ils couverts par la loi numérique et les chercheurs pourront-ils exercer leur droit d’exploitation secondaire pour y publier leurs textes ?

La réponse est vraisemblablement oui, alors même que ces acteurs peuvent avoir une activité directement ou indirectement commerciale (notamment à travers l’exploitation des données personnelles ou la proposition d’options payantes à leurs utilisateurs).

En effet, la loi numérique précise que la version publiée par le chercheur ne doit pas faire l’objet d’une activité « d’édition à caractère commercial », or les réseaux sociaux scientifiques n’exercent pas d’activité éditoriale au sens propre du terme.

On peut d’ailleurs peut-être regretter que le texte de l’article 30 profite ainsi par ricochet à ces acteurs, dont le positionnement devient au fil du temps de plus en plus problématique, et qui exerce une forme de « concurrence » vis-à-vis des archives ouvertes…

3. Les chercheurs pourront-ils publier leurs travaux sous licence Creative Commons ? 

On l’a vu, la loi limite les possibilités de réutilisation commerciale des publications diffusées en libre accès par les chercheurs. Or certaines licences Creative Commons (CC0, CC-BY, CC-BY-SA) autorisent les réutilisations à caractère commercial. On peut donc en déduire que le droit d’exploitation secondaire reconnu aux chercheurs ne permettra pas d’utiliser ces licences dites « libres » pour publier leurs travaux en archive ouverte ou sur un site personnel. S’ils faisaient cela, un tiers pourrait en effet venir prendre leurs textes et les rééditer à titre commercial, ce que ne permet pas la loi.

Néanmoins, il existe plusieurs licences Creative Commons (CC-BY-NC ; CC-BY-NC-SA ; CC-BY-NC-ND) qui maintiennent l’interdiction d’usage commercial. Ces licences pourront tout à fait être retenues pour la diffusion en Libre Accès des versions publiées par le chercheurs en vertu de leur droit d’exploitation secondaire. La plateforme HAL propose d’ailleurs depuis le passage à la v3 l’usage de ces licences à ses utilisateurs.

 ***

J’espère que ces clarifications pourront être utiles et si vous avez une question relative à l’application de ce texte qui n’est pas couverte par ce billet, n’hésitez pas à le signaler en commentaire.

Questions supplémentaires posées par les lecteurs de ce billet suite à la publication :

  1. La loi s’applique-t-elle aussi aux publications d’auteurs étrangers permanents ou invités dans des établissements français ?

Quand on regarde attentivement le texte, on constate que le critère principal est celui de l’origine des crédits qui financent l’article de recherche : « par des dotations de l’Etat, des collectivités territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne« . Donc un chercheur étranger, officiant de manière permanente ou temporaire au sein d’un établissement français, sera à mon sens bien couvert par la loi du moment que son activité est financée à plus de 50% par de l’argent public.

On peut aussi penser que si un article est co-signé par plusieurs chercheurs, dont l’un au moins est français, et qu’il a bien été produit principalement sur des fonds publics, le chercheur français pourra procéder à une dépôt en archives ouvertes sur le fondement de la loi numérique, à condition d’obtenir l’accord des autres co-auteurs (condition mentionnée par le texte).


Classé dans:open access Tagged: archives ouvertes, auteurs, éditeurs, contrat d'édition, Libre accès, loi République numérique, open access, recherche