Les vocabulaires contrôlés au service de l’interopérabilité sémantique des systèmes d’information environnementaux
La capacité à lier entre elles des données issues de différents systèmes d’information repose sur l’utilisation de vocabulaires contrôlés, partagés selon les bonnes pratiques du Web Sémantique.
Pour pouvoir être comprises sans ambiguïté en dehors de leur système d’information d’origine, les données doivent être décrites à l'aide d'informations qui explicitent leur signification en renvoyant vers des vocabulaires contrôlés de référence (liste de code, nomenclature) partagés.
Les termes des vocabulaires contrôlés doivent être identifiés par des HTTP URI publics, de façon à pouvoir être accédés et réutilisés. Ils sont gérés par des outils de registres de données liées (Linked Data Registry).
Les travaux du pôle INSIDE autour de la gestion et de l'exposition des vocabulaires contrôlés portent à la fois sur :
- l'exposition des vocabulaires nationaux selon les bonnes pratiques du Web Sémantique et leur alignement (mise en correspondance) avec les vocabulaires internationaux ou disciplinaires de référence
- l'outillage nécessaire à une telle gestion et exposition via l’identification d'une solution open source de référence
L'avancée de ces travaux contribue également à la dynamique européenne de "Fédération de registres" portée par la directive INSPIRE, les équipes du pôle INSIDE font à ce titre partie du groupe d'experts INSPIRE monté sur le sujet.
Zoom sur la Fédération de registres INSPIRE (INSPIRE Register Federation) :
L'infrastructure de données INSPIRE nécessite la publication et la définition claire de la sémantique utilisée (thèmes INSPIRE, concepts, liste de code) ainsi qu'un moyen de les référencer par des identifiants uniques.
La Fédération de registres INSPIRE est le point d'accès centralisé aux registres correspondants. Mise en oeuvre par le JRC (Joint Research Centre - service scientifique interne de la Commission européenne), elle est connectée aux systèmes d'exposition des vocabulaires contrôlés de référence des infrastructures de données nationales.
Exposer les vocabulaires environnementaux nationaux : réalisations
Dans le cadre de leurs travaux sur l'exposition des vocabulaires contrôlés selon les bonnes pratiques du Web Sémantique, les équipes du pôle INSIDE testent l'exposition de certains référentiels du SIE selon les bonnes pratiques du web sémantique. A titre d'illustration on peut citer les Paramètres chimiques et hydrobiologiques, les Appellations de Taxon, les Unités de Mesure, les Méthodes de mesures, etc...
L'action des équipes consiste à :
- identifier les vocabulaires contrôlés et ontologies de référence internationaux en environnement
- aligner les vocabulaires nationaux et ceux identifiés à l'international
- guider les travaux sur les vocabulaires nationaux
Gérer les vocabulaires : appropriation d'une solution open source
Nécessaires à toute initiative de production, de consolidation et d'exposition de vocabulaires pour le Web Sémantique, les solutions de gestion et d'exposition de registres de données liées ont pour fonctionnalités prinicipales la création, la maintenance et l'évolution des listes de codes et de leurs identifiants (URI).
Afin d'identifier une solution de référence pour les travaux du pôle INSIDE et pour transmettre ensuite celle-ci aux Systèmes d'Information de l'OFB et à ses partenaires, deux solutions majeures du domaine open source ont été mises au banc d'essai :
- l'UKGovLD Registry (solution développée par l'UK Government Linked Data Working Group et la société Epimorphics)
- le Re3gistry (solution développée par le JRC)
A l'issue de cette évaluation, les équipes du pôle INSIDE ont retenu la solution UKGovLD Registry, rejoignant dans leur choix des organisations telles que la NOAA (National Oceanic and Atmospheric Administration), l'Organisation Météorologique Mondiale, le CSIRO (Commonwealth Scientific and Industrial Research Organisation), l'OGC, EuroGeoSurveys (association des services géologiques), le ministère de l'environnement anglais (DEFRA).
En France, cette solution a également été retenue dans le cadre de la mise en oeuvre du registre national à destination des autorités publiques françaises productrices de données géo-environnementales et de la fédération de registres INSPIRE.
A ce jour, le pôle INSIDE et le BRGM financent certains développements d'évolutions sur cette solution open source.
En savoir plus
Transfert
Les équipes du pôle INSIDE procèdent de façon continue au transfert de l'expérience acquise vers les équipes des Systèmes d'Information de l'OFB, de ses partenaires et vers le groupe national 'référentiels communs' de l'OFB.
Ainsi le BRGM et l'IFREMER ont déployé l'outil UKGovLD Registry pour leurs besoins propres et commencent à structurer leurs vocabulaires contrôlés selon les bonnes pratiques identifiées.
Le ST Sandre et le SAR sont en cours d'appropriation de ces solutions et pratiques avec l'appui du Pôle INSIDE.
- Accéder au registre de Liste de Code du BRGM : https://data.geoscience.fr/ncl/
Dernière mise à jour le 18.05.2020