Qu’est-ce que la science ouverte change aux métiers de la recherche ?
Promue depuis bientôt dix ans, la science ouverte s’est durablement implantée en France et dans le monde. Loin de se cantonner à la seule question des données et publications scientifiques, elle a transformé en profondeur les pratiques de recherche.
Cette année encore, les indicateurs montrent une progression de la science ouverte en France. Les chiffres présentés en février par le ministère de l’enseignement supérieur, de la recherche et de l’espace (Mesre) dans le dernier Baromètre français de la science ouverte révèlent que près de 27 % des publications françaises partagent désormais leurs données. En moins d’une décennie, ce chiffre a doublé : elles étaient seulement 14 % à le faire en 2016. Le taux d’accès ouvert des publications scientifiques françaises s’élève quant à lui à 62 % et jusqu’à 70 % pour les thèses de doctorat.
Sous l’impulsion notamment des deux plans nationaux pour la science ouverte, lancés successivement en 2018 puis en 2021, le partage des informations et des données de recherche gagne peu à peu du terrain. Le plan national lancé en 2018 stipule que le développement de la science ouverte doit « permettre de construire un écosystème dans lequel la science sera plus cumulative, plus fortement étayée par des données, plus transparente, plus rapide et d’accès plus universel ». Il faut dire que cette pratique ne se cantonne pas seulement à l’ouverture de l’accès aux publications, rappelle Marin Dacos, coordinateur national de la science ouverte au Mesre : « Cela s’étend à l’ensemble du processus scientifique, aux données, aux logiciels utilisés, mais aussi aux méthodes et aux résultats négatifs qui doivent être davantage transparents notamment pour les essais cliniques ».
Les retombées liées au développement de l’ouverture de la science sont nombreuses, souligne Sylvie Rousset, directrice de la direction des données ouvertes de la recherche (DDOR) au CNRS : « En tout premier lieu, cela augmente la visibilité des résultats scientifiques. Un article en accès ouvert sera lu par davantage de personnes ». Une récente étude s’appuyant sur plus de 500 000 publications révèle en effet que les pratiques de science ouverte sont associées à un accroissement du nombre de citations. Le partage des données enclenche quant à lui un véritable cercle vertueux : « Le fait de les rendre accessibles permet aux autres scientifiques de s’en saisir afin de les retravailler ou de faire des recoupements avec d’autres données. À titre d’exemple, les données issues des observations du télescope Hubble ont conduit à plus de 21 000 publications, dont la moitié provient de scientifiques n’étant pas impliqués dans le projet de construction du télescope mais ayant travaillé par la suite sur les données rendues publiques », précise Sylvie Rousset. Le développement de la science ouverte contribue également au renforcement de l’intégrité scientifique : « D’autres chercheurs et chercheuses peuvent vérifier les résultats, refaire les expériences et signaler l’existence de problèmes, le cas échéant », indique la directrice de la DDOR. « Globalement, cela permet de s’orienter vers une recherche plus collaborative, plus reproductible, plus durable, et mieux diffusée au-delà du monde académique », souligne Marin Dacos.
Garantir une science ouverte gratuite et de qualité
Cependant, cette évolution vers le libre accès comporte aussi quelques effets négatifs, nuance Vincent Larivière, chercheur en bibliothéconomie à l'Université de Montréal1 et titulaire de la Chaire Unesco sur la science ouverte : « Certaines maisons d’édition commerciales en ont profité pour basculer d’un système où les lecteurs et lectrices payaient un abonnement vers un fonctionnement où les auteurs et les autrices doivent débourser d’importantes sommes pour publier. Une partie des budgets dédiés à la recherche scientifique se retrouve ainsi engloutie dans ces frais de publications souvent très élevés. D’autre part, ces revues n’ont aucun intérêt à refuser un manuscrit, et cela engendre alors un océan d’articles qui ne sont pas toujours d’excellente qualité ». Un système que dénonce Alain Schuhl, directeur général délégué à la science au CNRS : « En donnant la possibilité d’être publié moyennant paiement, le système auteur-payeur a accru la possibilité de publier une recherche aux antipodes de toute déontologie ou intégrité scientifique. Il a permis l’émergence de l’édition prédatrice, dont le modèle économique favorise la course à la publication sans aucune garantie sur la qualité scientifique des résultats publiés ».
- 1Faculté des arts et des sciences – École de bibliothéconomie et des sciences de l'information.
Afin de contrer ce phénomène, les alternatives aux revues commerciales se multiplient. « Il faut privilégier les solutions les moins coûteuses pour les acteurs de la recherche. Le modèle des revues diamant par exemple, soutenu par des institutions savantes et des fonds publics, n’engendre pas de frais pour les auteurs et les lecteurs », poursuit Vincent Larivière. Parmi ces solutions qui ont émergé au cours des dernières années, on retrouve l’infrastructure Open Edition, qui propose des publications axées sur le domaine des sciences humaines et sociales, ou encore la plateforme du Centre Mersenne pour les revues en mathématiques ou plus largement en sciences et techniques , ainsi qu’à l’étranger avec la plateforme canadienne Érudit. Les preprints, ou « prépublications » en français, jouent aussi un rôle déterminant dans le développement de la science ouverte. Ces manuscrits scientifiques qui n'ont pas encore été évalués par les pairs peuvent être mis en libre accès sur des plateformes dédiées, comme ArXiv ou HAL, qui sont appelées des archives ouvertes. « L’intérêt pour les preprints a connu une croissance immense au moment de la crise liée au Covid-19 car il était à ce moment-là absolument vital d’avoir un accès immédiat à la connaissance », se remémore Vincent Larivière. « On observe que 80 à 90 % des preprints finissent par être finalement publiés. Je suis donc plutôt favorable à l’utilisation immédiate de ces documents qui sont particulièrement pertinents lorsqu’ils sont mobilisés par les expertes et les experts du domaine », poursuit le chercheur en bibliothéconomie.
La relecture par les pairs en accès ouvert, ou « open peer review », commence également à être expérimentée par quelques revues. « Concrètement, il s’agit de rendre public le texte d’évaluation fourni par les relecteurs et relectrices », précise Marin Dacos. Mais pour l’instant, il est encore difficile d’estimer si cette initiative sera un jour généralisée : « Nous laissons les communautés explorer cette option afin de voir quels pourraient être les avantages et les inconvénients liés à ce type de processus », avance le coordinateur national de la science ouverte au Mesre.
Le « Tinder » des données en biochimie
Le développement de la science ouverte se matérialise aussi à l’échelle du Vieux Continent avec le déploiement de l’European Open Science Cloud (EOSC), qui ambitionne de devenir le futur réseau européen de données et de services pour la recherche formant ainsi « un véritable environnement de recherche virtuel », souligne Volker Beckmann, responsable de l’implémentation d’EOSC en France au sein du Mesre. Le programme est mené par une gouvernance tripartite formée par la Commission européenne, les États membres et l’association EOSC. Il rassemble déjà 14 nœuds qui correspondent à une thématique particulière, ou bien à un ensemble d’infrastructures, d’outils et de services proposés par un pays. « EOSC a vocation à offrir une solution permettant de partager et de mettre en relation les données et les différents services dans de multiples domaines. Le but sera, à terme, de couvrir dans quelques années l’ensemble des domaines scientifiques et d’impliquer tous les pays européens. C’est en réalité un véritable enjeu de souveraineté pour la recherche en Europe », confie Volker Beckmann. Parmi les 14 premiers nœuds retenus par EOSC, on retrouve notamment l’infrastructure de recherche Data Terra, dont la candidature était portée par le CNRS. Cette e-infrastructure nationale regroupe une immense quantité de données liées à l’observation du système Terre, au climat, et à l’environnement. « Cependant, il reste toujours nécessaire de rendre ces dernières FAIR, c’est-à-dire Faciles à trouver, Accessibles, Interopérables et Réutilisables. Il y a donc un important travail à mener avec les chercheurs et les chercheuses afin de les sensibiliser sur ces aspects », souligne Volker Beckmann.
La réutilisation des données peut en effet littéralement transformer la manière de faire de la recherche. Désormais, certains scientifiques délaissent parfois les expériences et les analyses en laboratoire afin de se concentrer sur les mines de données déjà disponibles. C’est notamment le cas du projet MDverse, lancé en 2019 par Matthieu Chavent, chercheur au Laboratoire de microbiologie et de génétique moléculaire1 et médaille de bronze du CNRS en 2023, et par Pierre Poulain, enseignant-chercheur au Laboratoire de biochimie théorique2 . Ce projet vise à collecter l’ensemble des données liées à la dynamique moléculaire, une technique numérique mobilisée afin de simuler et de prédire les mouvements des molécules les unes par rapport aux autres. « Pour la conception d’un médicament, cela permet par exemple de savoir comment une molécule chimique se fixe sur un récepteur », indique Pierre Poulain.
Afin de limiter l’usage de ces calculateurs, particulièrement gourmands en énergie, les équipes impliquées dans le projet MDverse récupèrent les nombreuses données de dynamique moléculaire réparties dans les entrepôts de données comme Zenodo ou Figshare. « À ce jour, on estime que près de la moitié des données générées dans ce domaine se trouvent en libre accès », indique Pierre Poulain. Mais pour rendre ces précieuses données réutilisables, il reste nécessaire de les étiqueter avec une couche d’informations supplémentaires : les métadonnées. « Nous mobilisons des approches basées sur l’intelligence artificielle afin d’identifier ces informations fondamentales dans les descriptions des jeux de données fournis par les scientifiques, détaille Pierre Poulain. Le logiciel utilisé et l’identité des molécules simulées sont par exemple des métadonnées déterminantes ». Une fois annotées, ces données sont ensuite mises à disposition de l’ensemble des chercheurs et des chercheuses sous la forme d’un catalogue. « Nous sommes en quelque sorte le Tinder de la dynamique moléculaire. L’objectif est de mettre en relation les scientifiques avec les données », confie Pierre Poulain. Un travail récompensé par le prix « Science ouverte des données de la recherche » en 2024. À noter que le Mesre propose depuis 2022 un entrepôt national Recherche Data Gouv pour partager toutes les données de la recherche qui ne bénéficient pas d’un entrepôt thématique spécifique.
Cependant, toutes les données de recherche ne peuvent pas être partagées, rappelle Volker Beckmann : « Nous gardons toujours en tête l’idée d’être aussi ouvert que possible, mais également aussi fermé que nécessaire. Certaines données, notamment dans la recherche médicale ou en sciences humaines et sociales sont en effet particulièrement sensibles ». « Il ne s’agit absolument pas de se lancer dans une ouverture déraisonnée, abonde Marin Dacos. Certaines données ne pourront jamais être ouvertes, et ce pour des raisons légales ou stratégiques ».
Une ambition internationale
« Le développement de la science ouverte se heurte également aux freins liés à l’évaluation de la recherche qui ne doit plus se restreindre exclusivement aux indicateurs bibliométriques comme le facteur d’impact de la revue ou le taux de citation d’un article », constate Sylvie Rousset. Ces dernières années, les alternatives pour publier dans des revues qui soient à la fois en libre accès et sans frais de publication progressent mais certains auteurs déplorent un manque de visibilité des revues diamants pour réellement franchir le cap par crainte que leur évolution de carrière en soit ralentie. Pour la directrice de la DDOR, il est nécessaire de « casser cette dynamique liée au prestige des publications, et de mettre davantage en avant l’impact réel des travaux scientifiques plutôt que les indicateurs quantitatifs ». « La mise en place du CV narratif pourrait être une piste d’amélioration, propose Marin Dacos. Si vous avez passé plusieurs mois dans l’année à construire une base de données qui offre une utilité collective au monde scientifique, il faut pouvoir le mettre en avant en mentionnant par exemple ce travail dans une courte liste détaillant vos productions majeures ». Pour développer davantage la science ouverte, il sera donc nécessaire de faire évoluer durablement les pratiques du monde de la recherche, en France comme à l’international. C’est l’objectif de la Coalition for Advancing Research Assessment, qui compte plus de 800 institutions à travers le monde, dont le CNRS fait partie des premiers signataires dès son lancement en 2022. Cela passe également par la formation des jeunes chercheurs et chercheuses : « Nous avons notamment mis en place des formations obligatoires à la science ouverte au niveau des écoles doctorales », souligne Marin Dacos. Avec l’espoir que ces nouvelles pratiques essaiment ensuite dans les laboratoires.
« Nous constatons que le taux d’accès ouvert aux publications est peu à peu en train d’atteindre un plateau. Il est donc nécessaire de renforcer cet accompagnement au développement de la science ouverte sur la durée, afin que ce processus devienne plus simple, plus rapide, et plus facile », juge le coordinateur national de la science ouverte au Mesre. La loi de programmation de la recherche, votée en 2020, fixe un objectif ambitieux : atteindre 100 % de publications en accès ouvert à l’horizon 2030. « De toute évidence, les derniers kilomètres seront les plus difficiles à parcourir », analyse Marin Dacos. Une position que tempère Sylvie Rousset : « Des signaux très positifs nous donnent confiance. Certains organismes, dont le CNRS, ont en effet déjà atteint cet objectif grâce à une politique incitative pour encourager le dépôt des manuscrits dans les archives ouvertes telles que HAL ».