Un des grands chantiers de Parchemins est jusque-là resté discret sur notre site internet… Et pourtant, en lisant cette brève, vous le touchez en ce moment-même du regard ! Il s’agit des activités développées autour du système d’information du programme de recherche, c’est-à-dire, l’ensemble des outils reliés les uns aux autres et qui permettent de partager nos données. Le site parchemins.bzh -également consultable à l’adresse agriculturelittorale.fr- est l’un de ces outils.
Ce chantier, entrepris depuis le lancement de Parchemins, a pour objectif de mettre en partage des travaux menés au sein du programme, à la fois entre chercheur·e·s, auprès de nos partenaires, mais aussi plus largement. Cette mise en partage concerne en particulier les données de recherche produites ou mobilisées dans le cadre de Parchemins, qu’elles soient issues des enquêtes ethnographiques sur nos cinq terrains, des recherches en agronomie, ou encore qu’elles concernent les données spatiales ou statistiques mobilisées par l’équipe. En somme, nous cherchons à mettre en place un système qui permette d’accéder aussi bien à une photo, une observation de terrain ou un discours d’acteur, qu’au nombre d’exploitations agricoles en activité dans une commune pour une année donnée, à des relevés sur la pluviométrie sur le territoire breton, ou à des statistiques sur le prix du foncier, etc.
Les enjeux sont de plusieurs niveaux. D’abord pour les chercheur·e·s impliqué·e·s dans Parchemins, il s’agit de pouvoir stocker et partager en toute sécurité leurs données avec les autres membres de l’équipe scientifique, et ainsi rendre possible des analyses transversales et interdisciplinaires à l’échelle du programme. Cela s’inscrit dans les habitudes de travail pour les chercheur·e·s en sciences de l’environnement (en agronomie et en géomatique en particulier), bien équipé·e·s pour et engagé·e·s de longue date dans la mise en partage de données principalement produites ou mobilisées dans des projets collectifs. L’enjeu est en revanche nouveau pour les ethnologues, qui travaillent généralement plutôt sur leurs propres données d’enquêtes. Dans cette communauté, les réserves vis-à-vis du partage sont nombreuses. Ce, en particulier parce que la démarche ethnographique implique que la subjectivité du regard du·de la chercheur·e est incorporée dans chaque donnée qu’il·elle produit sur son terrain d’enquête, la rendant souvent indissociable de son contexte de collecte. Les méthodologies d’enquête reposent de surcroît sur la création d’une relation de confiance avec les interlocuteurs du terrain, renforcée par une dimension juridique liée à la protection des données à caractère personnel (Règlement général sur la protection des données). Partager les données ethnographiques à « l’état brut » (sous réserve que cet état puisse caractériser ce type de données), même au sein d’un collectif restreint, n’est pas une pratique courante et spontanée dans la communauté scientifique française. Cette démarche est plus répandue dans le monde anglo-saxon.
Pour tous, chercheur·e·s en sciences humaines et sociales (SHS) comme chercheur·e·s en sciences de l’environnement, l’enjeu de partage au sein du collectif Parchemins de données si hétérogènes par nature, relève ainsi de l’exploration, de l’expérimentation, du tâtonnement et de la découverte…
Un second enjeu renvoie à une ouverture plus large des données, c’est-à-dire à leur accessibilité au-delà de notre collectif de recherche, en les rendant publiques. Là encore, les sciences de l’environnement sont engagées dans ce mouvement de longue date, notamment sous l’influence de la Convention d’Aarhus. Signée en 1998, elle qui préconise « l’accès à l’information, la participation du public au processus décisionnel et l’accès à la justice en matière d’environnement ». Ces principes sont opérationnalisés dans le contexte européen par la directive INSPIRE, qui « vise à établir en Europe une infrastructure de données géographiques pour assurer l’interopérabilité entre bases de données et faciliter la diffusion, la disponibilité, l’utilisation et la réutilisation de l’information géographique en Europe ». L’open data (l’ouverture des données) est en marche dans les sciences de l’environnement depuis bientôt deux décennies, et repose sur les principes partagés du FAIR (findable, accessible, interoperable, reusable = trouvable, accessible, interopérable et réutilisable), non sans poser de multiples questions et débats – notamment ceux de la propriété intellectuelle. À l’inverse, ce mouvement débute très timidement du côté des SHS : poussés par les mêmes ambitions, notamment celles de la réutilisation ou de la mise en partage des données produites sur fonds publics (voir la Loi pour une République numérique), les chercheur·e·s en sciences humaines et sociales et a fortiori les ethnologues restent largement sur la réserve vis-à-vis de ce mouvement. L’ancrage des pratiques de recherche individuelles, les enjeux de confidentialité associés aux données, la protection des sources, ou encore le respect de données à caractère personnel comptent parmi les diverses dimensions qui entrent en tension avec cet objectif d’ouverture. Un guide publié très récemment en 2018 recense et documente les formes de cette tension entre ouverture et protection des données et tente de faire la lumière sur les enjeux nouveaux embarqués dans l’objectif de « diffusion numérique des données SHS ». Il traite en particulier des dimensions éthiques et juridiques.
En se plaçant dans une logique d’expérimentation des conditions et des effets liés à ce mouvement d’ouverture – davantage que dans une logique de réponse à des demandes institutionnelles – Parchemins mobilise tous les chercheurs et ingénieurs du programme sur ce chantier ambitieux. Ce travail s’appuie jusqu’à présent sur une forte dimension opérationnelle : nous sélectionnons et développons des outils numériques qui permettent cette mise en partage des données pluridisciplinaires et hétérogènes au sein du collectif, en considérant les conditions de confidentialité et de sécurité, les besoins pratiques, les questionnements scientifiques, la facilité d’utilisation des outils, etc. Nous nous projetons aussi dans les conditions et les possibles modalités de réutilisation des données au-delà de notre projet. Articulés les uns aux autres, les outils que nous adaptons à ces divers besoins constituent un système d’information aux multiples fonctions : stocker des données (ce que permettent les outils cloud et le catalogue CKAN), pouvoir réaliser une requête par mots-clés transversale aux différents jeux de données et visualiser les données trouvées (ce que permet le catalogue CKAN grâce à un moteur de recherche), rendre visible les recherches et analyses en cours (grâce au site internet que vous consultez actuellement), rendre disponibles des représentations spatiales de données statistiques caractérisant l’évolution et la situation de l’agriculture sur le territoire breton (grâce à l’outil mviewer), etc.
De manière complémentaire à ce volet opérationnel, le collectif s’interroge sur ce que produit cette ambition de mise en partage des données. Nous nous demandons comment et dans quelles conditions ce partage est-il possible en pratique? Dans quelles mesures transforme-t-il les pratiques des chercheurs ? Outre les directives institutionnelles diverses, pourquoi ouvrir nos données, et pour qui ? Nous engageons en 2019 une enquête auprès de tous les chercheurs et de quelques partenaires du programme, pour répondre à ces questions et comprendre à partir de leur expérience comment se vit dans la pratique cet objectif d’ouverture des données et quels déplacements il crée. Le suspens n’est peut-être pas aussi grand que pour l’arrivée de la nouvelle saison de Game of Thrones, mais épisode à suivre donc !…