Ce n’est pas qu’une histoire de données
Les questions relatives à l’ouverture des données sont importantes. Pourtant ce n’est pas là le plus important car, si c’est nécessaire, ce n’est peut-être pas suffisant.
Il faut souligner que l’enjeu, au travers de l’ouverture des données, qu’elles soient d’origine publique (institutions et puissance publique) ou privée (organisations et entreprises), l’enjeu, disais-je, n’est pas tant d’exposer ses données mais plutôt son métier, parfois même son coeur d’activité.
Exposer ses données sans saisir que l’enjeu est d’exposer son activité, c’est ne pas comprendre qu’il s’agit de passer d’une logique dissociée à une logique associée et donc d’embrasser les opportunités des technologies relationnelles. On peut, par exemple, exposer ses données et continuer à travailler comme si de rien n’était, comme avant. Cela serait fort dommage, et je suis convaincu qu’il faut un peu plus que çà.
Si je fais cette remarque c’est parce cela a peu de sens d’exposer ses données juste … pour les exposer. On ne demande pas aux organisations d’exposer leur données pour jouer les inquisiteurs ou faire du « datajournalism », même si certains en font leur fer de lance sur cette question.
On leur demande cela pour qu’ils puissent nous mettre dans la boucle de leur activité pour créer un écosystème et un milieu associé (le web of data) dans lequel les données peuvent produire des externalités positives.
( Remarque au passage : « Raw data now! », scandait Tim Berners Lee. Je veux bien, mais les données brutes cela ne veut rien dire, une donnée n’est jamais brute, elle a toujours une forme et un format comme me l’a rappelé à juste titre Alain Pierrot. )
Je dis çà pour ceux qui seraient tentés de nous donner des données en pâture, avec une forte probabilité que ce soit des « junk data ». Nous voulons bien plus que des données quand nous parlons d’une économie de la contribution : nous voulons, et pouvons, changer les modèles de ceux qui les produisent et choisissent de les exposer.
Une histoire de données, ce n’est pas seulement une histoire de données, mais le prélude à une histoire de mise en relation, et donc le début de quelque chose qui peut échapper à ses initiateurs.
C’est pourquoi il me semble que les promoteurs et les contestataires se retrouvent d’accord qques fois pour parler plutôt de données:
– les premiers pour ne pas effrayer les seconds,
– et les seconds pour ne pas lâcher trop de lest aux premiers.
Et on ne dépasse pas trop ce stade.
Dans notre pays, moins ouvert semble-t-il au mode coopératif, je me demande ce qui peut débloquer une telle situation, à part une autorité supérieure bienveillant sponsorisant l’ouverture des données. Parce qu’actuellement, les API manquent:
http://blogs.sun.com/alexismp/entry/geoportail_le_retour
http://blogs.sun.com/alexismp/?entry=ou_sont_les_api_web
[Reply]
Bonjour Christian,
A propos de junk data, quelqu’un s’est emparé et a modifié le password de ma messagerie « voila » à laquelle je n’ai plus accès. Tu as peut être reçu d’étranges messages en mon nom disant que j’étais bloqué quelque part en Afrique et réclamant de l’argent. J’espère que tu n’en a pas tenu compte. Par contre je ne plus voir les messages du séminaire Simondon, peut tu me donner la salle prévue pour la prochaine séance de mardi. Je t’en remercie d’avance et excuse ma demande ici qui ne correspond pas au sujet du jour.
Philippe
[Reply]
Dans le contexte de la présentation de Tim Berners Lee, la notion de donnée brute est à mettre en opposition avec celle de donnée présentée, mise en page, prisonnière d’un document.
Il ne faut pas oublier qu’il se replace dans une optique d’histoire du web, et qu’un des buts de son exposé est de mettre en avant la possibilité d’utilisation des données via des Mashups (dont un exemple sera le sujet de son intervention l’année suivante).
Je pense qu’il faut comprendre sa formule comme un appel à la séparation du fond (les données) et de la forme (leur présentation sur le site web qui les héberge, leur apparition dans un document).
Il n’occulte pas la notion de format. Toute la fin de sa présentation s’organise d’ailleurs autour d’un format possible de mise à disposition des données (linked data) dans un but d’échange.
(pour rappel, la présentation ou Tim Berners Lee scande sa formule est celle de TED 2009)
[Reply]