Webinaire standardisation: panorama d’outils pour l’enrichissement et la qualité des données de mobilité
Title: Webinaire standardisation: panorama d’outils pour l’enrichissement et la qualité des données de mobilité
Event format: Webinar
Description: En continuité du cycle de webinaires sur la standardisation des données de transports multimodaux proposé par la Fabrique des Mobilités avec le soutien de la DGITM, ce webinaire portait sur les outils utilisés aux différentes étapes du cycle de la donnée de mobilité.
Les différents standards de données (GTFS, NeTEx, SIRI…) offrent un socle pour décrire plus ou moins finement l'offre de mobilité. Mais concrètement, quels sont les outils et services conçus pour interagir avec ces standards, afin d'en faciliter l'adoption et l'utilisation et en particulier celle des normes européennes NeTEx et SIRI ? Comment les opérateurs, AOM et réutilisateurs s'en saisissent pour enrichir leurs référentiels et manipuler une donnée de meilleure qualité ?
Pour répondre à ces questions, le webinaire s'est déroulé comme suit :
- Introduction Fabrique des Mobilités
- Présentation des grandes étapes du cycle de la donnée
- Rappel rapide des bénéfices apportés par des normes européennes
- Présentation de notre référencement (non exhaustif) d'outils à chaque étape
- Point d’attention sur les outils manquants (en particulier: dataviz NeTEx, liens SIG, intégration aux outils d'exploitation)
- Intervention de Brewenn Métayer, responsable de l'ouverture des données chez transport.data.gouv.fr, qui rappellera le rôle du Point d'Accès National (PAN) et de ses outils et services.
- Table ronde sur les retours d'expériences d'opérateurs et d'AOM, concernant leurs usages d'outils au quotidien et comment ces derniers ont aidé dans l'enrichissement et la montée en qualité des données, avec :
- Jérémy BOIG, RATP Cap Île-de-France
- Laura Roulier, Région Bretagne
- Questions-réponses
- Conclusion
Intervention d’ouverture – Alex Bourreau (La Fabrique des Mobilités)
Le cycle de vie de la donnée de mobilité
- Collecte
- Systèmes de planning (HASTUS, IVU, etc.)
- Systèmes billettiques
- SAEIV, SIG, outils de gestion d’infrastructures…
- Production au format standard
- Mise en forme des données dans un modèle de référence (Transmodel) ;
- Production de fichiers NeTEx, SIRI, GTFS, etc.
- Publication & diffusion
- PAN / transport.data.gouv.fr ;
- hubs régionaux ;
- portails open data locaux.
- Utilisation
- calculateurs d’itinéraires ;
- information voyageurs en temps réel ;
- tableaux de bord pour les AOM ;
- études et modélisation
Panorama (non exhaustif) d’outils
Remarques des participants
- Tu-Tho Thai: note importante, les outils d’Entur sont des fork d’outils français
- Laurent Chevereau : le convertisseur gtfs2netex de Hove, vous êtes sûrs qu’il fonctionne encore / est encore proposé par Hove? (en tout cas l’url ne fonctionne pas…)
- JG Pech : tu as aussi le logiciel Heurès (dans les outils d’exploitation) du groupe Lumiplan qui produit des données GTFS et (très) bientôt NeTEx ;-)
- Nathalie Pernot : Côté SAEIV, il y a aussi ISFM qui produit des données GTFS.
- Tu-Tho Thai : Il ne faut pas oublier OTP (Open Trip Planner) qui réutilise des jeux de données en NeTEx et SIRI depuis très longtemps.
- Tu-Tho : Dans le monde des SIG, il faut noter qu’on est déjà capable d’importer des extraits de jeux de données en NeTEx. Car ce n’est pas que limité à la partie accessibilité. Idem pour le projet QAccess
- noms de logiciels compatibles / plugins > https://gitlab.com/someware/qaccess/qaccess
“Trous dans la raquette”
- Manque d’outils simples de visualisation NeTEx pour les profils non techniques ;
- Chaîne encore fragile entre NeTEx ↔ SIG (intégration géographique, contrôle topologique) ;
- Peu d’intégration avec les outils d’exploitation
- Besoin d’outils “clé en main” pour les petites AOM
Intervention – Brewenn Métayer (PAN / transport.data.gouv.fr)
Rôle et mission du Point d’Accès National
- la porte d’entrée unique française pour les données de mobilité au sens des textes européens ;
- un catalogue et, pour certaines catégories, un hébergeur de données ;
- un intermédiaire entre :
- les producteurs (AOM, opérateurs, régions, gestionnaires d’infrastructures…) ;
- les réutilisateurs (applications, chercheurs, bureaux d’études, services publics…).
Le PAN n’est pas seulement une plateforme technique, c’est aussi un acteur de la qualité :
- en rendant visibles les jeux de données ;
- en fournissant des retours structurés sur leur qualité ;
- en accompagnant les producteurs dans leur montée en compétence.
Outils et services proposés par le PAN
En amont (production)
Le PAN est un centre de ressources qui aiguille les producteurs.
- Site “normes.transport.data.gouv.fr” gérée conjointement avec GT 7 a un statut légal
- Site “doc.transport.data.gouv.fr” est un centre de documentation géré par l'équipe du PAN
Le PAN propose des outils de validation des données.
- En lien avec le validateur de data.gouv.
- Dès que la donnée est publiée et mise en ligne, le réutilisateur peut disposer de données de qualité.
- Validateur NeTEx en cours de développement pour inclure les spécificités du profil France.
Le PAN propose des services spécifiques pour faciliter la diffusion du temps réél
- ex. Un requêteur SIRI qui génère la requête comme un réutilisateur l’aurait fait pour détecter les erreurs et assurer la découvrabilité.
- ex. Un serveur proxy permettant d’assurer de tenir la charge
Publication
1er niveau : mise en avant des indicateurs de qualité essentiels du jeu de données
- La donnée est-elle accessible & à jour ? Est-ce que je peux exploiter la donnée ou non ? Le PAN présente cette info.
2e niveau : validation des données dans le détail
- GTFS: nb d’arrêts, lignes sur carto dynamique, nb et catégorie d’erreurs
- Ex. Données de Rochefort. Affiche validation, indicateurs de qualité, et autres.
- Détail des données: on a détecté 4 AR en double. Simple à modifier.
Réutilisation
Espace producteurs & espace réutilisateurs
- avec des notifications, ex. si jeu de données est en favori, “le jeu va bientôt expirer”, ou “le jeu va probablement être bientôt mis à jour”
- Donc aussi des outils qui facilitent la gouvernance des données.
- Ceci n'est possible que sur données standardisées
- Les espaces favorisent des échanges continus, pour assurer des données de bonne qualité.
- Le concept est importé de data gouv. Possible de demander des infos, ex. Quand le producteur va mettre en ligne des données xx ?
Pilote de repartage des données GTFS.
- Expérimentation avec réutilisateur Google.
- Permet aux réutilisateurs de transmettre en privé leur jeu de données retravaillé au producteur via leurs espaces. Ce dernier choisi alors d'intégrer ou non les modifications, rendues visibles via l'outil GTFS-Diff.
- Ex. jeu republié : le réutilisateur a enlevé et modifié des lignes, changé la couleur des routes… Idée = l’AOM peut bénéficier de ces modifs et peut avoir la main pour valider.
- Pas un repartage tous azimuts, mais une gouvernance centralisée : 1 réseau, 1 jeu fiabilisé.
Perspectives du PAN
- enrichir les contrôles métier (et pas seulement techniques) ;
- proposer des interfaces plus pédagogiques sur la qualité (vulgarisation des messages d’erreur) ;
- renforcer les liens avec :
- les hubs régionaux et leurs propres chaînes de qualité ;
- les communautés (FabMob, AOM, éditeurs) pour co-construire les évolutions.
Jérémy Boig – RATP Cap IDF
Contexte et rôle de RATP CAP IDF
- la production et la consolidation de données de transport (bus, métro, tram, etc.) pour l’Île-de-France ;
- la diffusion vers différentes parties prenantes (IDFM, PAN, partenaires, réutilisateurs) ;
- Mais aussi vers les médias propres (rare acteur qui en possède): pages QR code aux points d’arrêt ; les autres opérateurs doivent passer par les médias IDFM (sauf RATP maison mère et Transillien)
- la réutilisation interne des données, ex. datalake, applis comme logiciel d’antifraude
Cartographie simplifiée de la chaîne IV RATP CAP Île-de-France
Les outils Chouette et Ara qui servent d’agrégateur d’offre sont au cœur du système d’informations dédié à la chaîne d’informations voyageurs. Ils permettent de centraliser en un point de référence tous les enrichissements de données afin de pouvoir les exporter sous différents formats : GTFS et NETEX pour le théorique, GTFS-RT, SIRI et API GraphQL pour les données temps réel.
- exemple d'enrichissement : géolocalisation imprécise dans véhicules, rafraîchissements toutes les 5 secondes via un boîtier (et non 20 sec).
Cas concret 1 : Enrichissement de l’offre GTFS pour fournir un NETEX
Problématique : L’offre produite par nos outils est exportée en GTFS. La donnée n’est pas assez riche pour permettre d’alimenter les données des référentiels d’Île-de-France Mobilités.
Solution : Chouette permet d’enrichir les données grâce à un système de jeux d’instructions et nous permet d’ajouter toutes les informations nécessaires. Par ailleurs, la synchronisation des données de référentiels des applications d’Île-de-France Mobilités permet de compléter la structure nécessaire au bon fonctionnement nécessitant des identifiants différents entre l’offre théorique et l’offre temps réel.
Laura Roulier – Région Bretagne
Contexte régional
- territoire avec une multiplicité de réseaux et d’opérateurs (interurbain, urbain, scolaire, maritime…) ;
- TER: seul opérateur = SNCF
- CAR : ~20 opérateurs. Pas tous ont un outil métier de modélisation de l’offre de transport GTFS ou NeTEx
- Bateaux : 4 opérateurs. Certains peuvent fournir GTFS, d’autres non.
- aussi, nombreux systèmes : un calculateur d'itinéraire, des systèmes billettiques différents (scolaires, urbain), des mécanismes de distribution (m-ticket, boutique en ligne), des systèmes SAEIV à bord des véhicules..
- Cela aboutit à des référentiels différents, incohérents notamment au niveau des identifiants
- rôle de la Région comme agrégateur et coordinateur des données transport ;
- besoin de fournir des données :
- aux calculateurs régionaux ;
- au PAN ;
- à d’autres partenaires publics.
Les défis de mise en place d'un référentiel
Le plus long: cadrer le projet, mobiliser les bonnes ressources, se structurer en interne.
La région s’est fait accompagner par un bureau d'étude pdt 6-7 mois, avec 3 missions :
- spécifier le référentiel (besoins, contraintes - expression de besoins)
- choix des différents industriels
- et initier l’outil avec un 1er cas d’usage, les 1ers paramétrages.
Budget total : 50k d’accompagnement. C’est ce qui a permis la réussite du projet.
En interne, important d’avoir un chef de projet pilote, et des référents sur les différents consommateurs.
Objectifs et schéma cible
Objectifs
- Intégrer des bases de données issues des divers systèmes
- Garantir l’unicité des données (fusionner les données et créer une codification unique)
- Administrer/gérer/enrichir les données
- Consulter la donnée
- Constituer un référentiel
- Alimenter les systèmes avec des formats normés : GTFS en priorité
Schéma cible : avoir un outil centralisé (Chouette), importer depuis outils métiers, mais aussi saisir manuellement, et pouvoir alimenter tous les systèmes: billettique, open data régional qui vient alimenter le PAN, le CI, la boutique.
C’est cette approche qui a pu démontrer l’importance d’avoir des bonnes données pour alimenter tout le système.
Retour d’expérience sur le déploiement
La phase d’étude a duré de mars à septembre 2024, elle a porté sur la definition du besoin & choix de l’industriel (enRoute).
La mise en place de Chouette s'est déroulée entre septembre et décembre 2024. Le 1er cas d’usage a pris plus de temps (car sur 1 département). Les suivants, sur d'autres départements ont été plus rapides (1-2 mois).
Les avantages
- Autonomie de la Région sur ses données
- Mise en qualité des données : unicité, enrichissement, etc.
- Visualisation de la donnée
- Contrôle simplifié
- Jeux d’instruction
Les limites
- Le référentiel est « initié », chacun doit s’en saisir pour le pérenniser et monter en qualité : ne pas sous-estimer la pédagogie à mener en interne et auprès des transporteurs
- Lien billettique : automatisation impossible avec Kuba
- Format NeTEx : manque d’expertise côté Région + volonté des transporteurs à s’en saisir ?
Day: 2025-11-17T09:30:00.000Z
Fin de l'évènement : 2025-11-17T11:00:00.000Z
Time:
Place:
Geocode the address to put it on the map
Link to report:
Tags: Fabmob2025
Theme:
Community(ies) of interest: Standards Ouverts pour des MaaS d'intérêt général
Participants:
Referent (person): Alex Bourreau
Contact:

Français
English
Italiano