Le marché noir de l’édition scientifique

Sur le Web, dans des endroits discrets car non indexés par les moteurs de -recherche, existent de véritables bibliothèques clandestines, fournissant gratuitement leurs contenus. Guillaume Cabanac, enseignant-chercheur en informatique à l’université de Toulouse, vient d’analyser sans doute la plus importante : près de 23 millions d’articles scientifiques et plus de 1 million de livres et manuels de science peuvent être téléchargés gratuitement. L’une des plus grosses bases de données scientifiques, PubMed, en recense à peine plus, sans y donner libre accès.

Comme le chercheur l’explique dans la -revue JASIST de mars, cela représente 68 % du catalogue des trois plus gros éditeurs, -Elsevier, Springer et Wiley, et 38 % de tous les articles publiés. Si le premier article scientifique publié en  1665 par la Royal Society s’y trouve, la moitié de ceux disponibles a moins de quinze ans. 27 100 journaux, incomplets, sont présents, soit près de 80 % de tous les journaux existants. Plus de 75 000  livres concernent les maths, 50 000 l’histoire ou l’informatique.

 » Après qu’un doctorant m’a parlé de ce site, j’ai voulu estimer sa couverture. Notamment pour savoir ce qui se passerait si, pour cause d’abonnements de plus en plus chers, les bibliothèques se désabonnaient « , raconte Guillaume Cabanac.  » Lorsque j’étais étudiant à Columbia, j’ai rencontré beaucoup d’étrangers qui me -disaient qu’ils ne seraient pas là s’ils n’avaient pas eu ces ressources pirates « , rappelle Dennis -Tenen, enseignant à l’université Columbia (New York) et qui, en novembre  2014, a publié dans Computational Culture une étude plus historique sur ces bibliothèques clandestines.  » Ces bibliothèques de l’ombre ont un fort -impact sur l’accès à la connaissance, mais elles restent peu étudiées « , regrette le chercheur.

2 700 nouveaux articles par jour

Dennis Tenen se refuse d’ailleurs à les considérer comme de vulgaires sites de téléchargements illégaux de films ou de musique.  » Les valeurs des fondateurs sont différentes. Ils n’œuvrent pas pour le divertissement mais pour l’accès à la culture et le développement des -connaissances, a-t-il constaté. Cette communauté a un but constructif. Ses membres ne parlent pas de piraterie ou de droits d’auteur. Ils veulent donner accès à des ressources que ne peuvent fournir leurs universités. Nous n’avons pas voulu citer leurs sites pour les protéger car certains pourraient perdre leur emploi. «  Il rappelle que les universités américaines, jusqu’au XIXe  siècle, ont aussi enfreint le droit d’auteur européen et copié livres et articles…

Ces énormes collections ont été assemblées en Russie et leurs archivistes ont tenu compte des déboires d’un précédent site, Gigapedia, aussi baptisé Library.nu. En février  2012, ce dernier a fermé à la suite de plaintes des éditeurs. Comme le décrivent Guillaume Cabanac et Dennis Tenen dans leurs deux articles, les -successeurs ont opté pour une structure -décentralisée : n’importe qui peut installer son propre serveur de distribution de la gigantesque archive (42 teraoctets) pour créer des sites miroirs aux noms divers.

Guillaume Cabanac a aussi analysé la manière dont ces bibliothèques se remplissent. Soit article par article, soit par ajout massif. Ainsi le 30  avril  2013, 12  millions d’articles ont été déversés ! Mais la moitié du temps, depuis le lancement, il y a moins de 2 700 nouveaux articles par jour mis à disposition. Pour cela entrent en jeu d’autres sites. Par exemple, des requêtes individuelles utilisant le mot-clé #Icanhazpdf sur Twitter ou bien le forum -Reddit et sa sous-catégorie Scholar. Guillaume Cabanac évalue à 17 000 par an le nombre d’articles demandés sur Reddit. Jean Liu, de l’entreprise Altmetric, estimait, en mai  2013, que sur Twitter, c’est environ dix fois moins, en progression lente et régulière.

Bien entendu, ces pratiques n’existent que parce que la majorité des articles sont payants : plus de 85 % sur PubMed, évaluait Adam Dunn en novembre  2014 dans JMIR. Cette part devrait baisser avec le développement important de l’édition en open access qui rend gratuit le téléchargement.  » Nous connaissons les activités de ces sites et des solutions techniques et légales sont à l’étude « , explique Helen Bray, porte-parole de l’éditeur Wiley.  » Les conséquences pour les revues sont en cours d’évaluation « , conclue Dennis Tenen.

  • David Larousserie (Le Monde 22/04/2015)