Introduction aux archives ouvertes et à l'Open Data
Les archives ouvertes sont des plateformes en ligne permettant l’accès libre et gratuit à des documents numériques validés par les communautés scientifiques. Le mouvement des archives ouvertes s'inscrit dans une perspective d’accès libre et gratuit aux résultats de la recherche scientifique.
L'Open Data désigne des données numériques dont l'accès et l'usage sont laissés libres aux usagers. Ces données sont diffusées de manière structurée selon une méthode et une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.
L'ouverture des données patrimoniales s'inscrit dans cette double dynamique d'accès libre au savoir et de diffusion élargie des données publiques. Elle offre de nouvelles perspectives pour la valorisation et la transmission des fonds d'archives.
Les avantages de la diffusion en Open Data des archives
Faciliter l'accessibilité des fonds patrimoniaux
La mise à disposition des inventaires d'archives en Open Data permet de les rendre accessibles à un large public. Elle facilite leur consultation à distance par les usagers, chercheurs comme grand public.
L'Open Data garantit un accès facilité et permanent aux données, sans restriction. La barrière technique est levée par la mise en ligne sur des plateformes dédiées. La barrière juridique est levée par l'application de licences ouvertes. La barrière financière est abolie par la gratuité d'accès.
Elargir la diffusion et la valorisation des fonds
Les données ouvertes offrent de nouvelles perspectives en termes de diffusion des contenus patrimoniaux. En s'affranchissant des canaux de diffusion traditionnels, les institutions peuvent toucher des publics beaucoup plus larges.
La mise à disposition en Open Data permet par ailleurs d'intégrer facilement les données d'archives dans de nouveaux environnements numériques. Les contenus patrimoniaux peuvent ainsi être valorisés sous de nouvelles formes.
Stimuler l’innovation par la réutilisation des données
L'ouverture des données publiques favorise leur réutilisation par des tiers : citoyens, chercheurs, entreprises, développeurs, etc. Cela stimule l'innovation en permettant la création de nouveaux services et usages à partir de ces données.
Les archives ouvertes en Open Data permettent par exemple le développement d'applications valorisant le patrimoine, l'enrichissement de sites web, ou encore la réalisation d'études inédites.
Les principes de l'ouverture des données d'archives
Utiliser des formats ouverts et lisibles par machine
Pour garantir une diffusion optimale, les données doivent être structurées dans des formats lisibles et exploitables par des applications. Les formats les plus répandus sont le CSV pour les tables, le JSON pour les données structurées et le XML pour les données complexes.
Ces formats standards permettent une meilleure interopérabilité des données et facilitent ainsi leur traitement et leur réutilisation.
Proposer des licences ouvertes
Les licences open data conditionnent les possibilités de réutilisation des données. Il est recommandé d'opter pour des licences ouvertes sans restriction d'accès ou d'usage, comme les licences CC0 et ODbL.
Ces licences offrent les libertés de réutiliser, modifier et partager les données, y compris à des fins commerciales. Elles sécurisent juridiquement les producteurs et les usagers des données.
Respecter les standards internationaux
L'adoption des standards internationaux du web de données garantit l'interopérabilité technique des données. Elle permet aussi d'enrichir et de lier les données à d'autres datasets.
Les standards du web sémantique comme RDF, SPARQL, SKOS, Dublin Core, etc. sont à privilégier pour une meilleure intégration dans l'écosystème du web de données.
Garantir la pérennité et la mise à jour des données
La diffusion en Open Data impose de garantir l'accès pérenne aux données, ainsi que leur mise à jour régulière.
La pérennité nécessite de choisir des solutions techniques fiables. La mise à jour impose de définir des processus efficaces entre producteurs et diffuseurs des données.
Ces bonnes pratiques sont essentielles pour construire la confiance des usagers dans les données diffusées.
Les étapes clés pour ouvrir ses données d'archives
Sélectionner les données à ouvrir
Toutes les données ne se prêtent pas à une ouverture en Open Data. Une sélection rigoureuse des datasets pertinents est nécessaire, en fonction de leur valeur, de leur qualité, de leur demande et de leur caractère diffusable.
Priorité est donnée aux données à fort potentiel d’usage : données référentielles, fonds les plus consultés, données récentes, etc.
Préparer et documenter les jeux de données
Une préparation minutieuse des données est indispensable avant leur ouverture, pour garantir leur qualité : contrôle et nettoyage des données, documentation, normalisation éventuelle.
Une documentation détaillée doit accompagner chaque jeu de données : définitions, modalités de production et de mise à jour, licences, formats de diffusion, etc.
Diffuser les données sur des plateformes Open Data
Pour une large diffusion, il est recommandé de publier les jeux de données à la fois sur la plateforme open data de l'institution et sur des plateformes généralistes comme data.gouv.fr.
L'inscription dans des portails spécialisés, selon le type de données, peut également être pertinente pour toucher les publics experts.
Faciliter la découverte et l’accès aux données
Des dispositifs d’accès faciles aux données doivent être prévus : pages de recherche, systèmes de filtrage, API pour les accès automatisés, systèmes de suivi des usages, etc.
L’utilisation des métadonnées standardisées est déterminante pour référencer efficacement les ressources et en améliorer le référencement.
Mettre en place un processus de suivi et d'amélioration
L’ouverture des données doit s’inscrire dans une démarche d’amélioration continue. Un suivi des usages et des usagers doit permettre d’identifier les points d’amélioration : qualité des données, documentation, demandes d’ajouts ou d’évolutions.
Focus sur les plateformes pour la diffusion des archives ouvertes
Les plateformes institutionnelles
De nombreux établissements proposent leur propre plateforme Open Data pour diffuser leurs ressources numériques. Les Archives nationales disposent par exemple de data.archives-nationales.culture.gouv.fr
L’avantage est de disposer d’un canal privilégié, connu des publics, pour mettre en avant ses collections. Cela permet aussi un contrôle total sur la structuration des données.
Les plateformes publiques multithématiques
Les portails Open Data publics comme data.gouv.fr ou data.europeana.eu permettent de toucher un public très large. Ils bénéficient d’une forte visibilité et de fonctionnalités avancées.
Par contre, cela impose de se conformer aux standards des plateformes et aux formats de données prédéfinis. La mise en valeur spécifique des collections est aussi plus limitée.
Les plateformes spécialisées sur le patrimoine
Des plateformesopen data sont dédiées au patrimoine culturel, comme par exemple data.culture.gouv.fr en France ou OpenGLAM pour les galeries et bibliothèques.
Elles ciblent les publics experts et offrent des fonctionnalités spécifiques aux données patrimoniales. Le moissonnage par les agrégateurs y est également facilité.
Accompagner l'ouverture des données
Former les équipes
La diffusion en Open Data constitue une transformation importante dans la manière de gérer, produire et diffuser les données numériques. Elle implique donc de mener des actions de formation auprès des équipes pour accompagner cette transition : aspects juridiques, techniques, valorisation, etc.
Définir une documentation adaptée
Une documentation claire et complète doit être mise à disposition des producteurs et des réutilisateurs de données open data : guide des données publiées, modalités de contribution, licences, formats standards, conseils de réutilisation, etc.
Cette documentation est indispensable pour accompagner le passage à l’open data.
Mettre en place une gouvernance
Une gouvernance doit encadrer les processus de production et de diffusion des données ouvertes : rôles des contributeurs, validation des jeux de données, gestion des mises à jour, politique de contribution extérieure, etc.
Une telle organisation est garante de la qualité des données diffusées et de la pérennité du dispositif open data.
Exemples d'utilisation innovante des données ouvertes
Des études inédites
L'enrichissement des données archivistiques par croisement avec d'autres sources permet de produire des analyses inédites. Par exemple, croiser des données d’archives avec des données géographiques offre de nouvelles perspectives d'analyse spatiale.
De nouvelles applications numériques
Les développeurs peuvent créer des applications grand public à partir des données ouvertes pour proposer des parcours de découverte ludiques ou immersifs des fonds d’archives : jeux, visites virtuelles, réalité augmentée, etc.
L’enrichissement d’autres ressources
Les données ouvertes sont réutilisées pour documenter des ressources tierces: intégration dans des articles wikipédia, augmentation de contenus de sites web, aide à la contextualisation d'images ou de collection, etc.
Elles permettent d'enrichir de nombreux projets autour du patrimoine sur le web.
Conclusion
L'ouverture des données d'archives en Open Data offre des opportunités majeures pour élargir l'accès au patrimoine et stimuler des usages innovants. Mais une telle démarche requiert un travail en amont sur les données ainsi qu'une diffusion suivant les principes FAIR : Facile, Accessible, Interopérable et Réutilisable.
Cette transformation numérique représente un moyen puissant de démocratisation de l'accès aux savoirs et une formidable opportunité d'innovation autour des fonds patrimoniaux. Archives ouvertes et Open Data sont donc amenés à jouer un rôle clé dans la transmission et la valorisation des patrimoines.
Vous pouvez nous contacter à:
Enregistrer un commentaire