Sur les métadonnées

Une métadonnée est aussi une donnée. C’est, au sens strict, une donnée sur une donnée.

Il y a un côté “mise en abîme” puisque toute donnée peut également être une métadonnée et, inversement, toute métadonnée peut en même temps être une donnée.

C’est sur cette ambivalence que repose le fonctionnement d’un moteur de recherche : il prend la donnée qui est entrée par l’utilisateur pour en faire une métadonnée de son index. Mis à part les mots vides (non pris en compte dans la requête) tous les mots des recherches effectuées avec les moteurs de recherche sont des métadonnées. Un système d’indexation full text est donc un système technologique qui fait de chaque mot une métadonnée, faisant ainsi l’économie du recourt à un système de classement, c’est à dire un système de métadonnées, dont il faudrait connaître le fonctionnement a priori.

C’est là le choc épistémologique que vivent les systèmes de métadonnées des bibliothèques depuis au moins une dizaine d’années :

“ À quoi bon un catalogue si j’accède au plein texte des oeuvres en choisissant moi-même mes métadonnées ?”

Il est évident que faire un catalogue avant le développement de l’indexation numérique en plein texte ou après n’a plus la même portée ni les mêmes enjeux. De même qu’il est évident qu’il faut plus que jamais avoir des institutions qui proposent des catalogues en tant que systèmes de métadonnées pour un certain accès aux données.

Ainsi, pas besoin de connaître un langage de requête informatique pour utiliser un moteur de recherche, il suffit de savoir lire et écrire pour poser des question à cette pythie numérique ; “ordinary language is all right”, comme disait Wittgenstein, suffisant en tout cas pour que chacun puisse utiliser un système de métadonnées sans même en avoir nécessairement conscience.

Mais comme on n’accède jamais directement aux données, que ce soit pour les créer où pour les consulter ; il y a toujours la nécessaire médiation d’une métadonnée ou d’un système de métadonnées pour manipuler une donnée.

Pour reprendre un vocabulaire que j’avais déjà utilisé (cf. Dataware et Metadataware ) : il n’y a pas de dataware sans metadataware, c’est à dire que l’on ne peut pas prendre soin des données sans prendre soin, en même temps, des métadonnées. Les métadonnées sont des conditions de création, de consultation et d’utilisation des données.

Essayez de créer une donnée sans métadonnée et vous verrez que c’est impossible, vous ne pourriez tout simplement pas parler de cette donnée puisqu’elle ne fait référence à rien.

L’écologie numérique qui cherche à se mettre en place avec les politiques d’ouverture des données doit en passer par le milieu des métadonnées. Encore une fois : le dataware se joue dans le métadataware, c’est d’ailleurs se qu’exprime le ranking du linked data :

make your stuff available on the web (whatever format)
★★ make it available as structured data (e.g. excel instead of image scan of a table)
★★★ non-proprietary format (e.g. csv instead of excel)
★★★★ use URLs to identify things, so that people can point at your stuff
★★★★★ link your data to other people’s data to provide context

 

Dans ces initiatives d’ouverture des données (Opendata), le débat se porte donc immédiatement sur les enjeux constitutifs du métadataware : formats, vocabulaires, systèmes de signifiants. Bref, sur tout ce qui participe à ce qui fait du sens dans une écologie relationnelle porteuse d’une économie relationnelle.

11 Mar 2011, 11:50
by Sarro Philippe

reply

Pour info

Colloque sur la participation des amateurs dans l’univers numérique, le vendredi 18 mars à La Cantine

http://lacantine.org/events/colloque-digital-life-lab-institut-telecom-paris

[Reply]

[…] Christian Fauré » Sur les métadonnées […]

Le système vise à l’équilibre.

Les objectifs pour atteindre cette fin sont des moyens.
Un moyen intrinsinquement déséquilibré sera équilibré par un objectif déséquilibré(!).
Toute information est une donnée.
A chaque donnée est lié un identifiant unique.
(Les identifiants uniques seuls, contrairement à leurs ensembles et parties, y dérogent.)
Chaque identifiant unique est une métadonnée.
Une métadonnée est une donnée et inversement.
Une relation entre deux données est une donnée.
Un ensemble de données est une donnée.

Le système vise à l’équilibre.

[Reply]

Les moteurs de recherche, plus que jamais en cette fin de décénnie, ont besoin de plus en plus de meta données pour catégoriser les contenus qu’ils découvrent afin de les indexer. A l’heure de l’Intelligence Artificielle annoncée partout, c’est bien paradoxal que de devoir étiqueter ces medias pour qu’ils puissent être bien rangés et retrouvés par les algorithmes…

[Reply]

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.