Open Data – Comprendre l’ouverture des données publiques
Open data, comprendre l’ouverture des données publiques.
De Simon Chignard,Préface : Jacques-François Marchandise
Broché 192 pages
Prix : 15 euros TTC
ISBN-13: 978-2916571706
La donnée est au cœur du fonctionnement des territoires. Elle permet d’aider à la décision, d’évaluer les politiques mises en œuvre ou de faire vivre les services urbains de notre vie quotidienne (transports, vie culturelle, économie, politique sociale, etc.). L’open data — la donnée ouverte — mouvement apparu à partir de 2007, consiste en la mise à disposition d’informations publiques brutes qui ont vocation à être librement accessibles.
Cet ouvrage, le premier en France sur ce phénomène, permet de tout comprendre de l’ouverture des données publiques.
Simon Chignard propose une analyse critique constructive de l’open data, et donne les repères pour pouvoir l’utiliser dans le contexte français. Il éclaire le lecteur sur ses enjeux, ses limites et ses conséquences.
Il montre comment l’open data est une source d’innovation et en explique les bénéfices attendus. Il révèle la meilleure manière d’initier et d’animer une démarche d’ouverture de données publiques qui soit vraiment un levier de croissance, créateur d’emplois et de nouveaux services dans les domaines économiques, culturels, sociaux et de démocratie locale.
Enfin, il questionne notre capacité à vivre dans un environnement toujours plus riche en données, en applications et en services, pointe les risques d’un foisonnement d’informations difficile à maîtriser et à rendre pérennes, ainsi que les possibles dérives d’un fétichisme des chiffres et indicateurs.
Tout à la fois théorique et pratique, critique et stratégique, ce livre est une référence pour comprendre l’open data et une boîte à outils pour agir.
Cet ouvrage sera précieux autant pour les néophytes, qui ont besoin de comprendre l’importance du phénomène open data et des efforts qui sont faits en la matière, que pour les experts, pour qui il constitue une mise en perspective utile. Au premier rang, les décideurs et praticiens publics et les innovateurs numériques, mais aussi tous ceux, citoyens, associations et professionnels, qui vivent désormais dans un monde de données qu’ils se trouvent en mesure d’enrichir et de réutiliser à des fins très diverses. Les écueils sont nombreux, les enjeux importants. L’open data doit devenir l’affaire de tous, sous peine de ne bénéficier qu’à certains.
Jacques-François Marchandise, directeur de la recherche et de la prospective de la Fondation internet nouvelle génération (Fing) et directeur associé chez Items internationaux.
Simon Chignard est diplômé de Télécom École de Management. Il a participé dès 2010 à l’animation de l’ouverture des données publiques de Rennes Métropole, territoire pionnier en France. Conférencier, il intervient régulièrement sur le sujet et a publié plusieurs articles sur l’approche politique, sociale et économique de l’open data.
Consultant et formateur indépendant, il est à titre bénévole président de l’association Bug (innovation sociale et numérique) et vice-président de la Cantine numérique rennaise.
De Richard Stallman aux transports publiques en passant par la démocratie locale, les données ouvertes, les big data, l’open government, le journalisme de données, les hacker spaces, la gouvernante, les innovateurs numériques, etc., ce livre traite en profondeur de tous les aspects de l’open data en France et dans le monde.
A l’heure de la démultiplication des données, de la multiplication de leur mode de production (capteurs, crowdsourcing ), du type de producteurs (communautés, individus isolés, entreprises parfois modestes, collectifs organisés, initiatives publiques, etc.) et des modalités de traitements des données, nous sommes confrontés à un écosystème nouveau en profonde mutation qui appelle des dispositifs d’apprentissage, d’exploration et d’appropriation adaptés. Nous ne sommes pas confrontés seulement à une profusion des données, mais également à la complexité de l’écosystème de production et d’usage des données. Nous ne sommes pas seulement confrontés au développement des données publiques, mais à toute sorte de données que nous allons être appelés à manipuler de plus en plus : données personnelles, mesures médicales, données de consommation, données collectives… dont il va nous falloir comprendre le sens, être “formé à la critique”, explique Simon Chignard
Préface Open data
par Jacques-François Marchandise
En 2012, l’ouverture des données publiques est en train de devenir, lentement, une réalité. Les pionniers sont au travail depuis trois ou quatre ans, mais entreprendre maintenant ce processus, c’est encore être un pionnier : la carte des initiatives françaises que tient l’association LiberTIC est toujours lisible et pertinente – songeons qu’il y a quinze ans on trouvait des annuaires des sites internet. Nous sommes donc dans ce curieux moment où se mêlent le concret et l’inconnu, les guides pratiques et les conjectures. Il est même permis de se demander si l’open data est une mode dont il ne sera plus question dans quelques années, ou au contraire une lame de fond. Le présent ouvrage nous aide à comprendre que l’open data a une histoire, une généalogie plutôt riche, assurément un avenir, et une certaine profondeur.
Dans cet ouvrage, Simon Chignard s’attache à « comprendre » l’ouverture des données publiques. Parmi les mérites de cette entreprise menée avec entrain, l’un des plus manifestes est la simplicité du propos et du langage, un autre est la complexité dont il rend compte, et cette combinaison est de bon augure. L’open data tel qu’il nous aide à le lire est une convergence, issue d’origines diverses, voire antagonistes. C’est, en Europe, une obligation pour les acteurs publics ; certains s’en trouvent confortés dans leurs missions et voient d’un bon œil les perspectives d’augmenter la valeur d’usage de leurs données, d’autres y voient le risque d’une dépossession de l’information qui a fait leur pouvoir, d’autres encore peuvent redouter que leurs données ainsi accessibles les exposent à la concurrence des opérateurs privés et les expulsent de leurs missions, mettant en danger le service public. La plupart y voit à la fois des coûts, des risques et des chances. Tous se confrontent à une remise en cause de leurs systèmes d’information plus ou moins récents, cloisonnés, dépendants d’éditeurs privés, détenteurs de données sensibles.
Mais cette transformation publique ne naît pas seulement d’elle-même. Les dynamiques publiques sont plus anciennes, on les trouve chez les géomaticiens et les statisticiens, dans les champs de la connaissance, de la culture, de la science ; citons pour mémoire la Banque numérique des savoirs d’Aquitaine, les rapports Ory-Lavollée, le développement des archives ouvertes comme HAL accueillant des travaux de recherche publique ou les efforts de mutualisation de l’internet public qu’incarne notamment le site service-public.fr. Dans ces quatre cas, les démarches menées vont à rebours de la marchandisation : la télématique publique a souffert de contrats de concession qui privatisaient sa mise en ligne et a opté pour le comarquage et le partage de l’information ; la science publique est confrontée à la domination commerciale de grands éditeurs mondiaux propriétaires des grandes revues ; le monde culturel a pu croire que son « patrimoine immatériel » était avant tout une manne financière ; et dans ces différents domaines, il paraît à la fois plus pertinent d’éviter une dérive mercantile et de préserver une part importante de biens communs, tant pour les missions publiques que pour l’intérêt des citoyens mais aussi de la vitalité économique. Ce qui est vrai pour l’information le sera-t-il pour les données ? Comment cette « ouverture » croisera-t-elle les approches qui font de la donnée le carburant des services ? Comment intégrera-t-elle les apports de ceux qui en font le levier d’un gouvernement « ouvert » ?
Simon Chignard rend lisible l’hétérogénéité des « trois familles » de l’open data : libérale, libérale-libertaire, participative – et mon parcours au contact des acteurs publics nationaux et territoriaux me fait lui proposer d’y adjoindre la famille des « soldats publics ». Cette typologie nous indique la diversité des mobiles de l’open data. Quoi de commun entre l’approche de « Brest en biens communs » et les approches qui visent à laisser faire le marché et à réduire le périmètre des acteurs publics ? Dès lors, il est difficile d’être purement et simplement militant de l’open data – au moins faut-il préciser les bénéfices attendus – et il est permis d’aller de l’avant tout en questionnant, d’allier pratiques et réflexion, et ce livre sera d’un grand secours aux praticiens réflexifs qui souhaitent comprendre ce qu’ils font.
Au-delà de la mise en perspective, il fait également œuvre utile par sa proposition de quatre classes de réutilisation (consultation, médiation, application, réutilisation spécialisée), comme par la profusion des exemples, des clés de lectures éclairantes et des éléments de décision qui sont proposés. C’est cette intégration dans un même ouvrage de dimensions habituellement séparées (théoriques et pratiques, critiques et stratégiques) qui rend ce travail singulier.
À certains égards, Simon Chignard incarne ce qui est en train de se jouer : son parcours professionnel l’a conduit à bien connaître le monde de l’entreprise et le marketing, son histoire personnelle est marquée par les implications associatives, d’abord dans le micro-crédit (à l’ADIE) puis dans le numérique à vocation citoyenne, avec l’association Bug, à Rennes. Bug est aux premières loges du laboratoire d’innovation numérique qu’est la ville de Rennes depuis une bonne décennie : tout s’y expérimente, avec une subtile combinaison publique-associative-technologique-entrepreneuriale portée par un écosystème vigoureux. En 2009, Simon participe à la création de la Cantine numérique rennaise, lieu de rencontres et de travail au croisement de différents réseaux ; Rennes s’engage dans l’open data, il anime des rencontres sur le sujet à la Cantine, puis participe au jury technique qui analyse les applications et services du concours open data de Rennes, le premier en France. Il se trouve dès lors en position d’observateur embarqué, au contact de toutes les initiatives. Avec la Fing, il a participé aux ateliers du Forum Villes 2.0 que nous avions organisés à Rennes et connaît bien nos travaux sur la Ville 2.0 plateforme d’innovation ouverte. C’est très naturellement que nous le voyons prendre sa place dans les premières rencontres qui ont lieu aux quatre coins de la France, dont nous sommes parfois organisateurs, souvent contributeurs : de notre point de vue, il est l’un des membres actifs de la communauté Fing – ce qui n’aliène nullement sa participation à d’autres communautés ouvertes. La nouvelle répartition des rôles entre acteurs publics, privés, associatifs et citoyens lui est d’emblée familière : elle est dans sa pratique quotidienne.
Au-delà de l’ouverture des données publiques, la question de leur appropriation par le plus grand nombre, de l’élargissement de l’écosystème de production aux citoyens et aux entreprises, de l’élargissement des réutilisations à la sphère associative et aux médias est aujourd’hui devant nous. Notre capacité à vivre dans un environnement toujours plus riche en données, en applications et en services est aussi en question : risques d’un foisonnement difficile à maîtriser, d’une pérennité délicate à garantir, d’un fétichisme des chiffres et indicateurs qui nourrit toutes les inquiétudes de ceux qui pointent les dérives du management public, privé et même personnel. Parce que nous nous retrouvons volontiers dans cette curieuse articulation de l’enthousiasme des explorateurs et du doute des humains contemporains, nous voyons dans ce livre une étape de nos parcours croisés.
Cet ouvrage sera précieux pour les néophytes, qui ont besoin de comprendre l’importance du phénomène open data et des efforts qui sont faits en la matière, comme pour les experts, pour qui il constitue une utile mise en perspective. Au premier rang, les décideurs et praticiens publics et les innovateurs numériques ; mais aussi tous ceux, citoyens, associations et professionnels, qui vivent désormais dans un monde de données qu’ils se trouvent en mesure d’enrichir et de réutiliser, à des fins très diverses : les écueils sont nombreux, les enjeux importants. L’open data doit devenir l’affaire de tous, sous peine de ne bénéficier qu’à certains.
Comment l’open data est devenu un objet politique …
ACTE 1 - OBAMA
Le 21 janvier 2009, le 44 ème président des Etats-Unis prend ses fonctions. Barack Obama signe ce jour-là trois mémorandums, dont deux concernent le gouvernement ouvert et la transparence. C’est un acte politique majeur, qui marque un engagement fort de la part de la nouvelle administration et est souvent cité comme une étape importante pour l’open government. Un acte fondateur ?Peut-être, mais fruit du hasard, sûrement pas.
ACTE 2 - O'REILLY, LESSIG ET LES AUTRES
Près d’un an avant l’entrée en fonction d’Obama, un groupe d’une trentaine d’activistes et de praticiens de l’open government se sont retrouvés à Sebastopol en Californie, à l’invitation de Tim O’Reilly et de Carl Malamud. On connaît bien le premier : auteur et éditeur américain, il a souvent été à l’avant-garde des mouvements de l’informatique et de l’Internet, de l’open source jusqu’à l’expression-même de Web 2.0 qu’il a défini et popularisé. Carl Malamud est une figure moins connue, du moins en France mais tout aussi intéressante. Ingénieur, il est notamment à l’origine des protocoles qui permettent la diffusion de la radio sur Internet. Il s’est ensuite beaucoup investi dans la mise en ligne des informations gouvernementales.
L’invitation mentionnait déjà l’ambition de la rencontre : définir les principes de l’open data et, si possible, les faire adopter par les candidats à l’élection présidentielle qui devait se dérouler l’année suivante.
La photographie du groupe ressemble à un Who’s Who de l’open government et du mouvement free culture. Outre O’Reilly et Malamud, on y reconnaît Lawrence Lessig, professeur de droit à Stanford et créateur des licences Creative Commons mais aussi les fondateur de GovTrack.us (l’un des tous premiers sites de suivi de l’activité du gouvernement fédéral), My Society (qui a mis en place au Royaume-Uni le site FixMyStreet) et d’EveryBlock (initié à Chicago, la ville d’Obama)… Diverses fondations y sont représentées dont bien sûr la Sunlight Foundation (co-sponsor de la rencontre avec Yahoo et Google) et l’Electronic Frontier Foundation (EFF).
Le groupe a échangé pendant deux jours afin de définir les 8 principesqui permettent de définir le concept d’open government data. On notera que le fruit de leur travail est passé à la postérité, car ce sont d’ailleurs souvent ces principes que l’on cite encore aujourd’hui – la Sunlight Foundation a par la suite rajouté deux principes à cette liste, dont la gratuité (cet épisode mériterait à lui seul un billet, j’y reviendrais ultérieurement).
ACTE 3 - STALLMAN ET RAYMOND
A l’issue de la réunion, Lawrence Lessig donne une interview où il compare l’effort de définition de l’open government data à celui réalisé par le mouvement open source. Arrêtons-nous un instant sur cette comparaison. Près d’une dizaine d’années avant cette
rencontre à Sebastopol, une ligne de fracture apparaît dans le domaine du logiciel libre entre les tenants du free software (Richard Stallman en tête) et les promoteurs de l’open source, menés par Eric S. Raymond (l’auteur de la Cathédrale et le Bazar). Le premier mettait en avant des vertus politiques et morales dans les valeurs du logiciel libre – il insistait beaucoup sur la notion de liberté. Le second trouvait que le logiciel libre avait avant tout une supériorité en termes de performances et que si on voulait favoriser une adoption plus large de ces outils, il fallait mettre de côté le discours en termes moraux – d’où l’idée aussi de promouvoir le terme d’open source plutôt que de free software. La biographie de Richard Stallman (Libre comme Liberté, éditions Framablog) revient en détail sur cet épisode.Tim O’Reilly a été l’un des plus ardents promoteurs de l’open source. Et, près de dix ans plus tard, il perçoit clairement l’intérêt à poser sa propre définition de l’open data…
ACTE 4 - (OPEN GOV) DATA ou OPEN (GOV DATA) ?
La définition proposée par le groupe de Sébastopol ressemble d’ailleurs davantage à celle de l’open source qu’à celle du free software. A aucun moment, il n’est fait mention deprincipes politiques ou moraux (même pas en introduction). On aurait pu imaginer que certains de ces principes fassent explicitement appel aux valeurs politiques de l’ouverture, de la transparence, de la société ouverte, … Les rédacteurs se sont concentrés sur l’expression de critères techniques – et non moraux.
Le titre de leur déclaration (8 principles on Open Government Data) est par ailleurssource de malentendus. Pour reprendre l’expression d’un chargé de mission de la Banque Mondiale, l’expression “Open Government Data” peut se comprendre de deux manières. (Open Governement) Data met l’accent sur la transparence de l’action publique (l’expression de gouvernement ouvert désignait traditionnellement la publication d’informations inédites sur les affaires publiques) alors que “Open (Governement Data)” est davantage porteur d’une promesse de participation.
Participation, transparence : voilà les deux principales promesses politiques de l’open data. Certains universitaires anglo-saxons (voir notamment l’analyse de Yul et Robinsonaux Etats-Unis et les articles publiés dans le dernier numéro de Community Informatics) soulignent déjà les tensions entre ces deux promesses, et l’une des principales responsables du programme open government d’Obama, Beth Simone Noveck regrette le choix de ce terme pour décrire son action. Nous verrons dans un prochain billet pourquoi les promesses de transparence et de participation peuvent potentiellement s’opposer … et comment elles prennent forme en France.
L’open data – entre promesses, réalités et limites : un modèle encore en devenir
Auteur du livre Open data, comprendre l’ouverture des données publiques (Ed. Fyp, Avril 2012, 192 pages), président de l’association Bug (innovation sociale et numérique) et vice-président de la Cantine numérique rennaise, Simon Chignard analyse l’état de l’open data aujourd’hui pour en comprendre l’évolution et les impacts futurs.
Comment former et éduquer le public à l’open data ?
Il y a un décalage entre les promesses de renforcement démocratique, de participation, etc., et le fait que l’open data n’est absolument pas grand public. L’open data est un concept encore mal compris, et dont la perception est souvent erronée. On ne peut donc toujours pas parlé d’appropriation par le grand public.
Il faudrait concevoir des formats de sensibilisation qui s’intéressent déjà à expliquer ce qu’est une donnée, en quoi elle est le carburant de notre vie quotidienne, de l’administration, des services qu’on fréquente au quotidien. Il faut montrer au public que les données sont partout. Il est important de donner aux gens la possibilité de se mettre en situation de les rechercher. Il faut les rendre visibles ainsi que les applications qui en découlent ; par exemple il existe à Nantes une application mobile permettant de suivre en temps réel l’occupation des parkings, à ce titre il faudrait que dans chaque parking de Nantes l’existence de l’application mobile soit signalée par des pancartes. La sensibilisation du public nécessite de combiner pratique et information.
Mais cette sensibilisation, à qui doit-elle incomber ?
Tout le monde, mais ça relève principalement de l’éducation (école ou éducation populaire). On pourrait tout à fait imaginer une semaine de la donnée à l’école sur le même modèle que la semaine de la presse à l’école. L’essentiel étant de prendre le temps de s’arrêter sur la donnée et de la décortiquer parce que, dès qu’on commence à rentrer dans le détail, on se rend compte de plein de choses étonnantes : typiquement, quand vous regardez les statistiques d’accidentologie, un blessé pour la direction départementale de l’équipement n’est pas le même blessé que pour les services de secours, il n’apparaitrait pas dans le même fichier et serait différemment catégorisé.
On peut lire dans votre livre que Keolis a été un moteur de l’ouverture des données à Rennes, quel rôle pourrait jouer le secteur privé dans la dynamique de l’ouverture des données ?
Les premières entreprises qui ouvrent leurs données sont des entreprises qui assurent une mission de service public. Peu importe que l’acteur soit privé ou public, tant que la donnée est collectée ou produite dans le cadre d’une mission de service public, elle est considérée comme publique.
Et puis il y a toutes les entreprises qui sont en fourniture d’un service quelque peu universel : banque, énergie, télécom. Pas nécessairement public mais universel.
Et l’hétérogénéité des pratiques ne constituerait-elle pas un frein à la généralisation de l’open data ?
Oui, mais ce qui est en train de se passer avec l’open data ressemble à ce qui s’est passé sur plein de projets en ligne. Les projets open source (ndlr : logiciels dont la licence autorise la libre redistribution, l’accès au code source et aux travaux dérivés) fonctionnent de manière similaire, on commence par des choses très décentralisées qu’on met ensuite en commun. Ce sont des projets indépendants qui partent de la base et qui se coordonnent par la suite plutôt qu’un grand acteur qui lance un mouvement déterminé.
Peut-on anticiper le succès ou l’échec d’une démarche open data ?
Je pense qu’il y a des ingrédients dont l’absence serait rédhibitoire. Le premier est de comprendre qu’on n’ouvre pas seulement des données. Il faut lâcher prise, ouvrir les données sans vouloir contrôler en amont ce qui va en être fait. On doit passer d’un modèle de contrôle a priori à un modèle de modération a posteriori. Et je pense que ça va être dur pour les acteurs (publics ou privés) qui ne sont pas habitués à gérer ce genre de modèle.
Il faut donc former ceux qui ouvrent des données au contexte qu’ils créent par l’ouverture des données ?
Parfaitement, je pense que l’open data est un projet d’innovation ouverte, il faut donc à la fois travailler sur le dedans et sur le dehors. Le deuxième facteur de succès est justement d’arriver à faire la balance entre le dedans et le dehors.
Quels types de données sont le plus réutilisés ?
Les données de la mobilité, elles ont une place vraiment à part dans l’open data pour au moins deux ou trois raisons. Ce sont les jeux de données les plus demandés par les développeurs (qui ne sont qu’une des catégories de réutilisateurs). Dans les villes les premiers jeux de données réutilisés sont les données des transports (vélo, bus, métro). Ensuite ces données restent celles qui génèrent le plus d’applications mobiles mais là, ça rejoint le problème de base de l’open data, à savoir qu’on le confond avec les applications. Et on ne peut pas faire une application de gestion budgétaire d’une collectivité sur smartphone. Je ne sais pas s’il y a beaucoup de données transports parce qu’on fait des applications mobiles ou si on fait des applications mobiles parce qu’on a beaucoup de données de transport, c’est le problème de l’œuf et de la poule.
Quelles sont les conséquences de la réduction de l’open data à des applications pour smartphones, y a-t-il un risque d’étouffement ?
C’est vraiment dommage et ça nous empêche de comprendre la dynamique qui est en train de se passer. Mais l’open data est jeune, la réunion où les huit principes de l’open data ont été posés s’est tenue en 2007 aux Etats-Unis. Rennes n’a ouvert ses données qu’il y a deux ans. On manque donc encore de recul.
Les réseaux sociaux ne sont pas plus vieux que l’open data et ont pourtant été dans les mœurs beaucoup plus rapidement, comment expliquez-vous ce décalage entre réseaux sociaux et open data et quels sont les éventuels liens qui les relient ?
Les réseaux sociaux et l’open data ne se sont pas diffusés à la même vitesse parce que les réseaux sociaux sont des services alors que l’open data est de la matière première. Mais en étudiant l’infomobilité (ndlr : informations sur la mobilité) des onze premières agglomérations françaises je me suis rendu compte que celles dont le compte Twitter était le plus actif étaient celles qui avaient ouvert leurs données (Rennes, Nantes et Bordeaux).
Il ne faut pas confondre corrélation et causalité mais je pense qu’il y a bien une corrélation entre les deux : les réseaux sociaux vous obligent à être dans une posture de dialogue, pas uniquement de discours à sens unique. Et les organisations publiques ou privées qui ont investi dans les réseaux sociaux sont bien placées pour comprendre qu’on est plus dans le dialogue que dans la communication descendante. Le rapport se situe à ce niveau là.
Quelles perspectives d’avenir pour l’open data ?
Il va y avoir une question, particulièrement en France, qui est celle de l’articulation entre l’Etat et les territoires. On a eu un open data des territoires assez fort, on commence à avoir un open data central assez fort, comment les deux vont émerger ? La deuxième question est de savoir comment les frontières de l’open data vont évoluer.
Je vois trois évolutions possibles : autour des données privées, autour des données personnelles et autour des données « crowdsourcées » (ndlr : ressources mutualisées). Pour l’instant, les champs de la donnée publique, privée, personnelle et « crowdsourcée » sont étanches mais je pense qu’ils le seront de moins en moins. L’une de mes craintes repose sur l’étanchéité de la frontière avec la donnée personnelle. Je pense que la donnée personnelle reste quelque chose qui doit rester relativement sanctuarisée mais il y a des initiatives qui visent à considérer la donnée personnelle comme étant avant tout une donnée.
Propos recueillis par Jade Bouchemit