Quatre visages des data

A l’heure où tout est data, je propose quatre visages des data selon une perspective généalogique de ce terme d’origine latine.

more »

Pourquoi l’économie numérique est-elle en dehors des radars des politiques économiques ?

Le numérique : programmes, réseau et données.

Il apparaît aujourd’hui évident que les enjeux du numérique s’articulent autour des données. Si l’on parle d’ingénierie numérique, il faut donc dire qu’il s’agit du Stockage, du Traitement et du Transfert des données (data). Dans les « Computer Sciences », ce focus sur les data dans les questions d’architecture logicielle a été pris très au sérieux dans la thèse de Roy Fielding en 2000 :

“As noted above, the presence of data elements is the most significant distinction between the model of software architecture defined by Perry and Wolf and the model used by much of the research labelled software architecture . Boasson criticizes current software architecture research for its emphasis on component structures and architecture development tools, suggesting that more focus should be placed on data-centric architectural modeling. Similar comments are made by Jackson.”

Si la bascule s’est faite dans le domaine de l’ingénierie à la fin des années 90, puis dans le domaine industriel dans les années 2000, elle reste à faire dans le domaine des politiques économiques.

Une économie industrielle en dehors des radars de la puissance publique.

lunettes

Les questions numériques sont donc indexées sur celles des données numériques, or celles-ci, en raison de leur granularité et de leur mobilité portée par des industries du transfert (il y a des flux de données numérique en économie comme il y a des courants sous-marins intercontinentaux dans le domaine environnemental), et bien qu’elles redéfinissent notre milieu et notre environnement, sont paradoxalement en dehors des radars de la puissance publique, et pas seulement en France. more »

Métadonnées et « teaser » sumérien

Un bel exemple d’éditorialisation sumérienne, avec utilisation des métadonnées ainsi que d’un teaser, trouvé chez Pascal Quignard :

« Une tablette lexicale provenant d’Uruk et datant du I° millénaire avant Jésus-Christ porte en bas de la surface d’argile un colophon mentionnant le nom du scribe, le titre de l’oeuvre (c’est à dire les premiers mots de l’oeuvre), le numéro de la tablette, le nombre de lignes qu’elle contient et les premières lignes de la tablette suivante (leur « réclame »), enfin la place où elle doit être rangée dans la bibliothèque de l’Eanna (i.e. le grand temple d’Uruk). » Petits traités, Tome 1, p. 379.

Le propre du transfert et le tranfert du propre (infrastructure studies)

Transport et Transfert

Parler d’infrastructure du numérique c’est toujours prendre le risque d’ennuyer son auditoire et de faire peur :

On va encore nous parler des « autoroute de l’information », d’accès internet à très haut débit, de la taille des tuyaux, etc.

Or je ne parlerai pas de tuyaux, ni d’accès internet à très haut débit, ni de fibre optique ou de Wimax. Non pas que ces questions soient secondaires — elles sont même nécessaires — mais ce ne sont pas les questions qui sont premières selon l’ordre des questions qui sont les miennes.

Mais alors, que reste-t-il de l’infrastructure du numérique si on fait abstraction des réseaux de transport ? Eh bien, ce qui reste — le reste qui m’intéresse —  ce sont les réseaux de transferts. Il s’agira donc ici d’infrastructures de transferts plus que d’infrastructures de transports. more »

Sens et enjeux des modèles de stockage et d’accès aux données

C’est typiquement le genre d’article qui nécessite des corrections, des remarques et peut-être un débat. Alors n’hésitez pas.

Code et data

Pas de code sans données, car le but d’un code est de tourner et de produire des résultats et, pour ce faire, le code doit “manger” des données.

On peut voir le code dans sa forme la plus abstraite comme un algorithme dont le rôle serait de produire des preuves. Mais on peut aussi voir le code comme un algorithme qui ne fait pas simplement que valider et prouver mais également qui produit des changements d’états et des évènements qui, au sens littéral du terme, changent le monde.

On a ici un parallèle avec les “speech acts” de Searle et Austin dont Henry Story avait parlé dans son intervention au MeetUp Semantic Web de Février 2011.

Quiconque écrit un programme s’attend en effet à “changer le monde”, ne serait-ce que pour écrire “Hello World” sur un terminal. Changer le monde avec des algorithmes et du code, Microsoft, Google,  Facebook et d’autres l’on fait, et l’ensemble des développements en Open Source peut-être plus encore.

Pas de code sans données donc.  Or ces données sont stockées dans des supports de mémoires différents selon qu’elles sont en mémoire vive, sur un système de fichier, ou dans une base de donnée. Et chaque support de mémoire utilise un modèle de données qui n’est pas forcément le même. Ce qui nous ramène à la difficile collaboration entre les développeurs et les gestionnaires de base de données.

Si les développeurs et les administrateurs de base de données doivent collaborer, la réalité est parfois toute autre : les développeurs ne comprennent pas toujours le SQL et les RDB (bases de données relationnelles), et les DBA (administrateurs de base de données) ne voient les développeurs que comme de dangereux cowboys qui veulent massacrer l’intégrité de leur données (“mon précieux …”).

Le DBA

Le développeur

more »

Sur les métadonnées

Une métadonnée est aussi une donnée. C’est, au sens strict, une donnée sur une donnée.

Il y a un côté “mise en abîme” puisque toute donnée peut également être une métadonnée et, inversement, toute métadonnée peut en même temps être une donnée.

more »