Quatre visages des data

by Christian on 18 avril, 2013

A l’heure où tout est data, je propose quatre visages des data selon une perspective généalogique de ce terme d’origine latine.

Les données immédiates de l’expérience

On traduit datum – le singulier de data – par donné(e). Et le mot dérive effectivement du verbe do / dare auquel l’ensemble des traductions suivantes se rattachent : donner, offrir, confier, remettre, admettre, accorder, permettre, concéder, présenter (source wiktionary).

Parler de data n’a de sens que dans le cadre de l’avènement du sujet dans la philosophie moderne Cartésienne, ce sujet qui reçoit les données du “monde extérieur”. C’est d’ailleurs en débat avec Descartes que Locke rejettera la notion “d’idée innée” en prônant un empirisme selon lequel nos idées ne sont pas déjà là, a priori, mais proviennent des données immédiates de l’expérience.

Le mot a ensuite pris un sens particulier au début du 20° siècle avec les débats des philosophes anglo-saxons autour des “sense data”. Les “sense data” sont ce qui nous est donné au travers de la perception (on retrouve les “données immédiates de l’expérience de Locke). Tout un débat a eu lieu pour savoir quelle interprétation donner à ses “sense data” dans la mesure où l’on peut poser que notre rapport au monde et à la réalité est toujours médiatisée par ce que nous en percevons aux travers de nos sens.

Les data comme informations faisant l’objet d’un calcul

En tant que “matériau brut” fourni par nos sens, les data ont ce caractère de matière première de la perception en attente d’être traitée par l’esprit. Se met ainsi en place l’idée que l’esprit procède par calcul (approche cognitive de l’esprit), une computation sur la base des data que nous percevons.

Si, au début, les data relevaient du don ou de l’offrande, leur emploi dans les théories de la perception va les inscrire dans le champ sémantique du calcul : comme matière première de l’usine à calcul qu’est l’esprit cognitif.

C’est sur la base de ces débats que la philosophie analytique, autrichienne puis anglo-saxonne, va populariser une définition fort utile des data : les data sont des informations qui peuvent faire l’objet d’une production ou d’une manipulation par le calcul.

Les data comme information stockée

Avec le développement de l’informatique de la seconde partie du XX° siècle, les data vont être associées, en plus du calcul, à celui du stockage. La chose était relativement inédite car jusqu’alors les data étaient toujours se qui se donnait sans pouvoir faire l’objet d’une mise en réserve : la data était reçu puis traitée, mais elle était évanescente.

A partir du moment où nous sommes mis à écrire pour les machines, il a bien fallu masser et stocker cette information qui doit être donnée à la machine.

Avec le développement du Software, il a fallu se rendre à l’évidence : les programmes n’étant plus des configurations Hardware, il existe donc des données qui sont des programmes, c’est à dire qui sont les écritures électroniques du calcul, de l’algorithme. Tous les programmes sont à présent des data, même si toutes les datas ne sont pas pour autant des programmes.

Les data comme objet de transfert

Après avoir été associées au calcul et au stockage, les data vont être associées, à la fin des années 90, au transfert ; renouant par certains aspects avec la définition latine originelle.

Regardons ainsi la définition que donne Roy Fielding dans sa thèse et qui est assez surprenante :

“A datum is an element of information that is transfered from a component, or received by a component, via a connector.” p. 11

Fielding précise :

“ this do not include information that is permanently resident or hidden within a component”.

Selon cette définition, si l’information ne fait pas l’objet d’un transfert entre différents composants d’une architecture logicielle, alors on ne peut pas parler de data.

Il faut que l’information « sorte du bois », qu’il y ait un transfert pour qu’elle puisse être qualifiée de data. La dimension de calculabilité et de stockage n’est plus ici déterminante.

A partir de ce moment, on peut dire que les questions de transfert sont des questions de data et, inversement, les questions de data sont des questions de transfert.

Les data dans l’écologie relationnelle des metadata

Il se trouve qu’une quatrième compréhension des data émerge au même moment que celle du transfert, il s’agit du discours sur les metadata en vertu duquel une data n’existe, et ne peut être utilisée, que pour autant qu’elle est qualifiée et catégorisée (elle a une signification explicite) par d’autres data, ces dernières étant explicitement qualifiées de metadata, c’est à dire des data de data.

C’est tout le discours et les débats autour des standards du web sémantique et du web de données qui a porté et continue de porter ce visage des data compris à partir de la question des metadata.

Les deux approches –  les data comme objet de transfert d’un côté et les data dans la perspective des metadata d’un autre côté – ne sont ni opposées ni incompatibles. C’est d’ailleurs ce que j’ai essayé de montrer en distinguant, mais sans les opposer, les démarches OpenAPI des démarches OpenData dans ApiCulture & DataCulture.

Print Friendly
Signaler sur Twitter

{ 0 comments… add one now }

Leave a Comment

{ 1 trackback }

Previous post:

Next post: