Agentforce, l'agent GenAI de Salesforce
Publiés sur la plateforme Data.sncf.com, plus de 200 jeux de données SNCF sont désormais ouverts au public. Cette ouverture des données fait suite à plusieurs lois contraignant les opérateurs publics, et notamment les transporteurs à ouvrir leurs données.
Publiés sur la plateforme Data.sncf.com, plus de 200 jeux de données SNCF sont désormais ouverts au public. Cette ouverture des données fait suite à plusieurs lois contraignant les opérateurs publics, et notamment les transporteurs à ouvrir leurs données. L’objectif de telles mesures est d’offrir la possibilité à tout un chacun de réaliser de nouvelles statistiques, développer des applications et services à partir de ces porteurs de valeurs.
Les jeux de données des transporteurs font-ils aujourd’hui l’objet d’une réelle ouverture ? Qui s’en sert et comment ? Les transporteurs tirent-ils toute la valeur et la richesse de cette contrainte imposée ?
L’ouverture des données constitue désormais une tendance inévitable pour les transporteurs, menée par la loi Macron (2015) et la loi pour une République Numérique (2016). Ces derniers doivent se saisir de cette obligation légale pour en faire une véritable opportunité de business et pour construire des services plus pertinents et intégrés pour leurs usagers.
L’ouverture des données n’est pas un sujet récent. Dès 1978, la loi loi de la Commission d’accès aux documents administratifs (CADA) fixait le cadre relatif à l’accès aux documents administratifs et à la réutilisation des informations publiques. En 2003, la directive 2003/98/CE fixe un ensemble minimal de règles concernant la réutilisation et les moyens pratiques destinés à faciliter la réutilisation de documents existants détenus par des organismes des États membres de l'Union européenne.
Ces dernières années, le cadre législatif a grandement évolué concernant les usages numériques et plus particulièrement l’utilisation des données par les entreprises. Les principaux bouleversements pour les acteurs du transport se retrouvent récemment dans la Loi pour une République Numérique du 7 octobre 2016 (aussi appelée loi Lemaire).
Cette dernière énonce notamment l’”Obligation pour les organismes publics et certains acteurs privés (titulaires de marchés publics, bénéficiaires de subventions) de mettre à disposition gratuitement sur internet leurs bases de données d’intérêt général”.
Ces données “d’intérêt général” peuvent concerner l’exploitation des services publics de l’énergie ou de l’eau, les transactions immobilières, la gestion et le recyclage des déchets mais aussi les transports publics. Les Établissements publics industriels et commerciaux (EPIC) comme la SNCF ou la RATP sont tout particulièrement concernés par ce texte.
Il y a également eu des changements en août 2015 dans le Code des transports, modifications issues de la loi pour la croissance et l’activité. Le nouvel article L 1115-1 du Code des transports stipule : “Qu’il s’agisse de « services réguliers de transport public de personnes » (train, métro, bus, avion...) ou de « services de mobilité » – de type vélos en libre-service ou co-voiturage –, les entreprises sont théoriquement tenues de diffuser « librement, immédiatement et gratuitement », dans un « format ouvert », des informations portant sur : leurs arrêts, tarifs publics, horaires planifiés, horaires en temps réel, l'accessibilité aux personnes handicapées, la disponibilité de leurs services, les incidents constatés sur le réseau”.
Aujourd’hui, tous les opérateurs de transport et de mobilité devraient appliquer les dispositions prévues par le code des transports d’août 2015. Seulement voilà : l’article concerné ne prévoit aucune sanction pour sa non-application et en pratique, l’ouverture des données semble parfois prendre du retard pour les transporteurs.
Comment l’expliquer ? Les entreprises soumises à l’article L 1115-1 du Code des transports sont « réputées remplir leurs obligations dès lors qu'elles adhèrent à des codes de conduite, des protocoles ou des lignes directrices, préalablement établis par elles et rendus publics » suite à leur homologation par l’exécutif. En optant pour ces chartes, les transporteurs sont autorisés à ne pas respecter certains principes posés par la loi Macron... Un « délai raisonnable » peut par exemple être prévu avant la mise en ligne de données. Surtout, des « dérogations au principe de gratuité » sont permises pour les « utilisateurs de masse », impliquant la mise en place d’abonnement pour l’accès aux données, comme cela peut être le cas pour les données de la SNCF à partir d’un certain seuil.
Les Assises de la mobilité qui se sont tenues fin 2017 ont révélé un enthousiasme des différents acteurs pour le sujet de l'open data, en particulier de la part des start-ups de la mobilité. Afin de stimuler l’innovation, la ministre des transports Elisabeth Borne a proposé à la suite de ces Assises de faire figurer dans la loi d’orientation « la mise à disposition des données de l’ensemble des modes, non seulement publics mais aussi privés ».
Le cadre législatif devrait ainsi évoluer dans les prochaines semaines : le projet de loi sur les mobilités, qui devrait notamment conduire à une réforme des dispositions législatives relatives à l’ouverture des données de transport, a été présenté le 26 novembre au conseil des ministres.
En France, la donnée de transport est la propriété du transporteur sauf dans le cas d’une Délégation de Service Public où elle est alors la propriété des Autorités Organisatrice du Transport (AOT).
Plusieurs options s’offrent aux propriétaires des données : garder les données en interne, les monétiser ou encore les mettre gratuitement à disposition. Toutes ces options répondent à des visions stratégiques différentes.
De nombreux services urbains reposent désormais sur la data, ce qui ne va pas sans soulever des questions cruciales sur leur maîtrise d’usage et leur gouvernance. Cette ouverture permet déjà la création de nouveaux cas d’usage par des acteurs hors transporteurs.
La SNCF fait partie des bons élèves. Le groupe a publié 114 jeux de données sur sa plateforme dédiée à l'open data au mois d’avril 2017. Au total 215 jeux de données sont désormais ouverts[1], majoritairement fournis par SNCF Réseau. La SNCF ne compte pas s’arrêter en si bon chemin et s’est dotée d’une charte destinée à encadrer l’ouverture de ses données. Ce document fait la synthèse entre la volonté interne d’ouverture des données, le cadre légal, et les recommandations de Transparency International, partenaire de SNCF sur le sujet.
De même, la RATP est depuis plusieurs années engagée dans l’open data[2], mais elle a dans un premier temps retenu ses données les plus intéressantes, dont les données en temps réel. En Janvier 2017, elle a finalement décidé d’ouvrir ses données « temps réel » sur les horaires de passage des métros, RER, bus et tramway aux différents arrêts et stations d’Ile-de-France.
Cette ouverture a nécessité la mise en œuvre de moyens informatiques importants pour doubler le parc de serveurs de la RATP (opération à + d’1M€)[3] afin de répondre techniquement aux requêtes massives de données (notamment de la part de Citymapper). Cela met en exergue le fait que l’ouverture des données ne se fait pas à moindre coût.
De son côté, Keolis a annoncé dès 2015 le lancement d’une solution Open Data dédiée à la mobilité en partenariat avec OpenDataSoft (entreprise spécialisée dans la transformation de données et à l’origine de la première plateforme de valorisation des données). Cette initiative a permis à Keolis d’anticiper la Loi Macron sur la mise à disposition des données de transport en allant dans le sens de l’ouverture et de la transparence, au service des collectivités et des voyageurs.
Si la mise à disposition des données relève d’une tendance inévitable pour les transporteurs d’un point de vue juridique, l’open data est une ressource dont pourraient profiter des entreprises de la tech, en particulier les GAFA. Les transporteurs français ont conscience de la “menace” représentée par ces acteurs dans la mise à disposition non maîtrisée et gratuite des données. En effet, ceux-ci disposent des ressources financières et techniques leur permettant de mettre à profit ces flux de données, dans l’objectif à terme de désintermédier les opérateurs.
Google a ainsi montré son intention de devenir le premier prescripteur de transport urbain via la division Sidewalk Labs d’Alphabet. Selon The Guardian, l’entreprise californienne se propose même de réorienter certaines subventions destinées au financement des déplacements en transport en commun pour un public précaire vers de nouvelles formes de transport (VTC, covoiturage) ; ceci dans le but de faire adhérer des municipalités aux solutions de stationnement et autres technologies offertes par la firme.
Autre exemple, Uber et sa plateforme Movement qui souhaitent renouer avec les pouvoirs publics en les fournissant en données : la mise à disposition des données collectées par les milliers de véhicules qui sillonnent les villes permettent d’obtenir une vision temps réel de l’état du trafic. Une vingtaine de métropoles en profitent d’ores et déjà : New Delhi, Londres, Cincinnati...
Le positionnement de ce type d’acteurs sur le secteur du transport public pourrait s’avérer problématique dans la mesure où il pourrait entraîner un démantèlement progressif de l’offre en transports en commun au profit de nouvelles offres de mobilité, privées ou entres particuliers. Les transporteurs ont aujourd’hui tout intérêt à accélérer le développement de services construits autour de la donnée. Le potentiel de la donnée est désormais certain, mais la menace des GAFA et autres acteurs de la tech oblige ceux-ci à innover rapidement pour ne pas se retrouver dépassés dans les prochaines années.
L’ouverture des données par les transporteurs va conditionner le développement de nouveaux services associés à la donnée. La promesse d’un trajet multimodal, ie empruntant plusieurs formes de transport, et en temps réel, doit permettre aux usagers de disposer d’applications de plus en plus sophistiquées, aux possibilités multiples : programmer un itinéraire en fonction de la météo ou de la pollution, emprunter une ligne de métro moins bondée, éviter un tramway dont la circulation serait perturbée, ou encore éviter l’autopartage en raison des bouchons annoncés. Cette promesse est notamment celle de la société City Mapper, dont l’application couvre et repense les transports d’une quarantaine de ville à travers le monde.
Dans l’objectif de faire de l’open data un moteur de l’innovation, Ile de France Mobilités s’est aussi lancé dès 2016 dans le développement d’une plateforme qui relève le défi de l’agrégation et le partage des données de la Ratp, la SNCF et Optile. Cette application, prenant en compte les différents modes de déplacement en temps réel et de façon prédictive, ambitionne à terme de proposer des “services intelligents”, ie adaptés aux usagers à l’instar de la prise compte des PMR.
Le développement de ce type de services - à grande valeur ajoutée - qui présuppose une qualification et analyse de données propre ainsi que des cas d’usages tournés sur le voyageur, doit permettre de proposer aux usagers une véritable expérience passager multimodale et connectée en door to door. L’open data relève par ailleurs d’un intérêt certain dans les projets de MaaS - Mobility as a Service - puisque les données d’usage et d’opération permettent d’acquérir une connaissance fine des déplacements sur un territoire donné. Le partage de ces données permettra ainsi d’améliorer les différents services proposés par les consortiums formés par les opérateurs et intégrateurs.
L’enjeu de l’intégration et de la connexion de tous les modes de transports passe donc par la mise à disposition non maîtrisée et gratuite des données.
La SNCF, la RATP, Transdev (le groupe de transport public contrôlé par la Caisse des dépôts) et BlaBlacar ont signé au printemps 2017 un protocole d'accord portant sur la création d'un “data warehouse”[4], littéralement un « entrepôt de données » qui centralisera les informations des quatre opérateurs sur leur activité, et notamment les horaires théoriques mais aussi en temps réel. Blablacar s’est finalement retiré par manque de fonds à investir dans le projet.
Ce data warehouse commun permettrait aux principaux acteurs français de se mettre en position de tirer profit de l’open data, le tout en préservant leurs intérêts. L’idée réside dans l’agrégation des données propres à ces opérateurs publics et privés, ceci constituant potentiellement la plus large base de données sur l’offre en transport terrestre en France, entre transport urbain et déplacement longue distance, train, bus, métro, ou encore covoiturage. L’objectif affirmé à terme étant la vente d’un billet unique regroupant l’intégralité des modes de transport.
Dans une logique de création d’une régie de données, cette plateforme intégrerait des modèles économiques différenciés associés à un mode de gouvernance mixte (public, privé, individus), dont le partage des données entre acteurs serait organisé par un tiers de confiance. Néanmoins, ce projet pourrait représenter une opportunité pour Ratp et Transdev (entre autres) de créer un service concurrent à Oui.sncf grâce la possibilité nouvelle de reproduire les tarifs établis par cette entité. La Sncf pourrait ainsi craindre un “effet Booking”[5] qui interposerait alors un nouvel acteur entre les clients et l’opérateur national.
L’open data impulse une véritable transformation des structures tant sur le plan organisationnel, technologique et juridique.
La menace des sociétés technologiques n'est pas le seul frein à l'ouverture des données. Publier ces informations en l'état n’est pas suffisant. Il faut les documenter, les maintenir. Tout cela a un coût que, à l’heure actuelle, le transporteur supporte généralement seul.
Il apparaît nécessaire que les opérateurs mettent dès à présent en œuvre des solutions techniques permettant de répondre à la demande propre à l’ouverture des données. A titre d’exemple, de nombreuses pannes ou autres ralentissements de l’application RATP sont survenues au cours de l’année 2016. Compte tenu du volume très important de requêtes auxquelles la RATP fait face, la nécessité de mettre en œuvre des moyens informatiques plus conséquents - notamment de doubler le parc de serveurs afin de répondre techniquement à la demande - s’est alors fait sentir.
Répondre aux requêtes massives de données concernant le “temps réel”, ie les horaires de passage des bus, métro ou encore tramway et RER aux différents arrêts et stations d’Ile de France, requiert donc une amélioration de la technique propre au stockage et à l’utilisation de la data.
Au-delà du coût de stockage et maintenance des données, l’open data se heurte à la problématique de la pertinence des données. Certains jeux de données peuvent aujourd’hui ne pas faire l’objet d’une utilisation pour cause de non pertinence ou de mauvaise qualité. En cause, peuvent aussi l’être un mauvais timing ou un manque de communication, qui entravent l’implémentation réussie d’un datawarehouse.
En sus de ces nouveaux outils, l’ouverture des données doit s’accompagner de nouvelles pratiques pour gérer la donnée. L’open data nécessite en amont la mise en place de processus de gestion de la donnée et des métadonnées pour permettre à terme leur ouverture. Un véritable cycle d’exploitation de la donnée doit être impulsé au sein de l’entreprise : processus permettant de collecter, stocker, exploiter, sécuriser/ouvrir les données, et ce, tout au long de leur cycle de vie. Cela implique la mise en place de nouveaux rôles au sein de l’entreprise qui officient donc tant sur le plan technologique (normalisation, entretien) que juridique et managérial.
L’open data implique donc en amont la définition d’une stratégie de data management avec les ressources humaines compétentes associées (spécialistes de data management, etc..).
Petit à petit les grands acteurs du secteur des transports publics se saisissent des opportunités de l’open data pour transformer leurs outils et processus de gestion de la donnée et créer de nouveaux services, plus pertinents et mieux intégrés pour les usagers. Les activités annexes des transporteurs pourraient à terme se voir modifiées sous l’impulsion des nouvelles perspectives qu’offrent le traitement et l'ouverture de la donnée. En 2015, un rapport de la commission[6] européenne évaluait à 75 milliards d’euros le marché de l’Open data à horizon 2020 ; le secteur des transports étant en bonne place pour impulser cette création de richesse.