Une métadonnée est aussi une donnée. C’est, au sens strict, une donnée sur une donnée.
Il y a un côté “mise en abîme” puisque toute donnée peut également être une métadonnée et, inversement, toute métadonnée peut en même temps être une donnée.
C’est sur cette ambivalence que repose le fonctionnement d’un moteur de recherche : il prend la donnée qui est entrée par l’utilisateur pour en faire une métadonnée de son index. Mis à part les mots vides (non pris en compte dans la requête) tous les mots des recherches effectuées avec les moteurs de recherche sont des métadonnées. Un système d’indexation full text est donc un système technologique qui fait de chaque mot une métadonnée, faisant ainsi l’économie du recourt à un système de classement, c’est à dire un système de métadonnées, dont il faudrait connaître le fonctionnement a priori.
C’est là le choc épistémologique que vivent les systèmes de métadonnées des bibliothèques depuis au moins une dizaine d’années :
“ À quoi bon un catalogue si j’accède au plein texte des oeuvres en choisissant moi-même mes métadonnées ?”
Il est évident que faire un catalogue avant le développement de l’indexation numérique en plein texte ou après n’a plus la même portée ni les mêmes enjeux. De même qu’il est évident qu’il faut plus que jamais avoir des institutions qui proposent des catalogues en tant que systèmes de métadonnées pour un certain accès aux données.
Ainsi, pas besoin de connaître un langage de requête informatique pour utiliser un moteur de recherche, il suffit de savoir lire et écrire pour poser des question à cette pythie numérique ; “ordinary language is all right”, comme disait Wittgenstein, suffisant en tout cas pour que chacun puisse utiliser un système de métadonnées sans même en avoir nécessairement conscience.
Mais comme on n’accède jamais directement aux données, que ce soit pour les créer où pour les consulter ; il y a toujours la nécessaire médiation d’une métadonnée ou d’un système de métadonnées pour manipuler une donnée.
Pour reprendre un vocabulaire que j’avais déjà utilisé (cf. Dataware et Metadataware ) : il n’y a pas de dataware sans metadataware, c’est à dire que l’on ne peut pas prendre soin des données sans prendre soin, en même temps, des métadonnées. Les métadonnées sont des conditions de création, de consultation et d’utilisation des données.
Essayez de créer une donnée sans métadonnée et vous verrez que c’est impossible, vous ne pourriez tout simplement pas parler de cette donnée puisqu’elle ne fait référence à rien.
L’écologie numérique qui cherche à se mettre en place avec les politiques d’ouverture des données doit en passer par le milieu des métadonnées. Encore une fois : le dataware se joue dans le métadataware, c’est d’ailleurs se qu’exprime le ranking du linked data :
★ |
make your stuff available on the web (whatever format) |
★★ |
make it available as structured data (e.g. excel instead of image scan of a table) |
★★★ |
non-proprietary format (e.g. csv instead of excel) |
★★★★ |
use URLs to identify things, so that people can point at your stuff |
★★★★★ |
link your data to other people’s data to provide context |
Dans ces initiatives d’ouverture des données (Opendata), le débat se porte donc immédiatement sur les enjeux constitutifs du métadataware : formats, vocabulaires, systèmes de signifiants. Bref, sur tout ce qui participe à ce qui fait du sens dans une écologie relationnelle porteuse d’une économie relationnelle.
Pour info
Colloque sur la participation des amateurs dans l’univers numérique, le vendredi 18 mars à La Cantine
http://lacantine.org/events/colloque-digital-life-lab-institut-telecom-paris
[Reply]