Le catalogage global des données

Cet article est tiré du livre blanc de Mathieu Becker (Isogeo) et Hervé Halbout intitulé "La gouvernance des données géographiques", disponible gratuitement via ce lien.
Après INSPIRE et l’open data, le catalogage “global” des données est le phénomène qui aura le plus affecté le monde de la gouvernance des données géographiques.
Ce phénomène est pourtant loin d’être nouveau : dès la sortie de la plateforme Isogeo en 2012, les premiers utilisateurs souhaitaient déjà voir élargir le périmètre de la solution aux données non géographiques (“maintenant que je maîtrise mes données géographiques, est-ce qu’il est possible de prendre en compte toutes les autres données ?”).
Mais le catalogage global des données est un projet complexe qui soulève de nombreux questionnements : comment y intégrer les données géographiques et leur gestion spécifique ? Supplante-t-il totalement les projets de catalogage de données SIG ? Quelle stratégie adopter face aux données non-structurées qui font également partie du patrimoine de données global d’un organisme ? Et quel est le véritable retour sur investissement attendu pour les agents et salariés ?
La nécessité de gérer l’ensemble de ses données
Depuis 2017, les projets de catalogage global des données se font de plus en plus nombreux, aussi bien au sein des collectivités que des grands-comptes privés.
Le phénomène du “data driven” est passé par là : ces projets semblent émerger d’une prise de conscience soudaine quant à la nécessité de maîtriser ses données pour une bonne gestion de son organisation en interne comme à l’externe...
Submergés par la masse de données disponibles, les organismes méconnaissent en effet souvent leur patrimoine de données qui n’est que partiellement catalogué.
La multiplicité des sources de données et leur stockage dans des silos indépendants accroît ce phénomène, et les données sont fréquemment dupliquées au sein d'un même système d’information.
Aussi, sur le terrain, de nombreux salariés et agents ignorent quelles données sont disponibles pour l'exercice de leurs missions et n’ont pas accès à leurs caractéristiques (cycle de vie des données, flux existants).
Pourtant, malgré les besoins actuels, il reste difficile de prédire aujourd’hui le futur des projets de catalogage global des données.
Quel avenir pour le catalogage global de données ?
La gestion de ces projets se révèle en effet très complexe, aussi bien sur le plan technologique que sur le plan organisationnel.
Avant de “sortir l’artillerie lourde” technologique, il nous semble alors nécessaire de définir clairement les objectifs du projet engagé et d'établir au préalable les opérations à déployer .
Aussi, même dans cette période orientée “data” où tous les espoirs d’un monde meilleur passent par la maîtrise totale de ses données, il est raisonnable de penser que la première vraie mesure à mettre en place reste la maîtrise, voire la diminution de la production de données pour ne conserver que ce qui est utile (à l’image de la gestion des déchets).
De plus, nous sommes convaincus que l’avenir de ces projets dépendra également des usages concrets qui pourront en découler.
S’ils sont actuellement poussés par des besoins tels que le RGPD ou la cybersécurité, qu’en est-il en effet des usages métiers ? Comment le catalogage global de données pourrait-il augmenter la productivité de l’entreprise ou la qualité des services des collectivités ?
En d’autres termes, quel pourrait être le véritable “retour sur investissement” d’un tel projet, au-delà des besoins réglementaires et sécuritaires portés par une DSI ?
La complémentarité des projets de catalogage globaux et SIG
Il est tout à fait légitime de se questionner sur la place des données géographiques dans un projet de catalogage global des données.
Il aurait été bien pratique que ces données se laissent indexer, inventorier et documenter comme toutes autres données, mais ce n’est pas le cas. La géomatique a effet dû développer des spécificités indispensables à son bon fonctionnement en marge du système d’information.
Aussi, dans le domaine de la gouvernance des données, le catalogage des données géographiques répond d’abord aux besoins des géomaticiens qui ont su en développer des usages concrets.
Prenons l’exemple d’un moteur de recherche de données dans un logiciel SIG comme QGIS : c’est une fonctionnalité simple et efficace, permettant de gagner un temps précieux et de produire des cartes et des analyses de meilleure qualité. En augmentant la productivité de l’entreprise, le projet est rentable tant pour l’administrateur des données qui maîtrise son patrimoine de données, que pour les usagers qui gagnent du temps dans leurs recherches.
Le catalogage global des données, lui, répond le plus souvent à des besoins plus larges : contrôle, (cyber)sécurité, etc.
C’est pourquoi il est utile de bien délimiter les finalités et enjeux de ces deux types de projets en amont de leur déploiement. Un projet de catalogage global des données ne répondra pas totalement aux besoins des géomaticiens (productivité, qualité des travaux…), et vice versa.
Ils ne sont pourtant pas incompatibles, bien au contraire ! Un projet de catalogage global pourra par exemple gérer d’une part les aspects RGPD et cybersécurité des données géographiques, et d’autre part communiquer et rendre visible ce “silo” de géodonnées au sein de l’organisme en général.
La solution de catalogage global des données de Dawizz & Isogeo

Bien que consciente de l’intérêt et des enjeux du catalogage global des données, la position de la société Isogeo est restée la même depuis sa création : se concentrer uniquement sur les données géographiques.
Cette question est tout de même restée omniprésente au sein de l’équipe jusqu’à l’arrivée sur le marché de la société Dawizz et de sa solution de catalogage global des données non géographiques (“MyDatacatalogue”).
Basées sur la même chaîne de valeur (recenser, documenter, valoriser), nos deux sociétés ont rapidement collaboré pour aboutir à un partenariat technologique permettant à nos clients de gérer et de valoriser l’ensemble de leur patrimoine de données : géographiques, non géographiques, structurées, non structurées...
La solution de catalogage global de données Dawizz-Isogeo permet ainsi :
- d’auditer les données en analysant les applications, les bases de données du SI, les catalogues existants (open data et SIG), les fichiers bureautiques...
- de cataloguer les données, de les inventorier et de les retrouver facilement en s’appuyant sur des dictionnaires publics de données (RGPD, INSPIRE…)
- de cartographier les données en recensant et localisant le patrimoine de données avec leur niveau de sensibilité (protection des données, confidentiel) et en analysant les liens entre les applications,
- de visualiser facilement les données en temps réal, avec des filtres, des alertes…
Le département des Pyrénées-Atlantiques a été l’un des premiers à tester cette solution début 2019.