Les enjeux d’une bibliothèque sur le web

by Christian on 8 juin, 2010

La plupart des débats sur le rôle et la présence des bibliothèques sur web s’est jusqu’à présent concentré fortement sur les enjeux de numérisation des fonds et sur son corolaire de diffusion des oeuvres numériques. Autre thème, mais dans une moindre mesure (surtout à l’échelle du grand public) : la mise en ligne des catalogues et la disponibilité des métadonnées des institutions qui les gèrent. Ces questions sont importantes, mais j’aimerais en proposer une troisième, qui s’appuie sur l’exposition des métadonnées, et constitue à mes yeux la clé de voute pour une stratégie des bibliothèques sur le web.

1. Avoir des ressources facilement identifiables et consultables sur le web

Chacun aura remarqué qu’il n’est pas facile de faire un lien vers l’URL d’un livre qui pointe vers les catalogues en ligne que proposent les bibliothèques. Moi-même, quand je parle d’oeuvres ou d’auteurs, je privilégie un lien vers la page associée chez Amazon ou Wikipedia, c’est tellement plus rapide. Mais, à part amener du trafic à ces sites, ce geste de faire un lien n’est pas valorisé en lui-même. Une bibliothèque doit donc commencer par augmenter la visibilité de ses ressources pour ensuite pouvoir donner de la valeur à mon lien.

L’exposition des métadonnées passe par la mise à disposition d’URLs pérennes pour l’ensemble des ressources signifiantes. Ces URLs doivent donc être pérennes (je vous renvoie chez figoblog pour la littérature et les réflexions associées), mais aussi  facilement identifiable (voire inférençable : par exemple, je peux déduire l’URL d’un auteur à partir de celle d’un autre), ainsi que déréfençables (cf. Qu’est-ce qu’une URI déréférençable ?). Point d’autre salut dans cette démarche que d’embrasser les standards du web sémantique et d’emboîter le pas à l’initiative Linked Data.

2. Exploiter la vie de ces ressources sur le web.

On n’envoie plus un satellite dans l’espace pour pouvoir dire « je sais le faire », mais pour exécuter une mission bien précise qui repose sur la collecte et la récupération de données. Par analogie, c’est cet objectif qui manque souvent aux stratégies d’ouverture et d’exposition des données. Je suis le premier à dire qu’il faut mettre à disposition les données sur le web, tout comme je suis le premier à dire qu’il faut du très haut débit. Mais si ces initiatives sont nécessaires, elles n’en sont pas pour autant suffisantes, car elles ne sont que les prémices d’une politique, il manque encore quelque chose. C’est notamment la raison pour laquelle je terminais mon texte dans « Pour en finir avec la mécroissance » en écrivant :

« Pire peut-être, ces politiques se limitent à favoriser l’accès à internet et à offrir des débits de connexion toujours plus important, mais pour quoi faire ? » p. 278.

Je crois qu’il faut partir de là : accéder à des contenus ou des données sur le web, d’accord, mais « pour quoi faire ? ». Je balaye ici d’un revers de main toute la rhétorique qui consiste à dire : « ouvrez vos données et vous verrez ce sera formidable ». Oui, je crois effectivement que ce sera formidable, mais ce discours ne favorise pas la prise de décision pour celui qui doit faire l’effort : il faut donc trouver d’autres motivations.

La logique et la stratégie de l’accès orientent trop souvent les débats autour d’une stratégie de diffusion. C’est très bien de diffuser, surtout quand il s’agit de ressources culturelles comme celles que gèrent les bibliothèques, mais je pense que ce n’est pas là que les choses se jouent. La plupart des bibliothécaires ne peuvent pas se satisfaire de concevoir le web comme un simple outil de communication et de diffusion. Le métier de bibliothécaire croule tellement sous la charge de travail que représente de la politique d’acquisition, de conservation, de gestion des catalogues, d’archivages, plus tous les aspects fonctionnels d’accueil du public, de relation avec les chercheurs etc. que la perspective du web comme nouvel outil de diffusion ne représente à leur yeux qu’une contrainte de plus qui va surtout donner lieu à une énième refonte du système informatique.

Faire tous ces efforts simplement parce que cela semble inéluctable n’est pas la meilleure des motivations qui soit. On revient donc à notre question « pour quoi faire? », car si la réponse est « parce que c’est nécessaire », on peut être sûr que c’est l’inertie qui va s’installer (pourquoi faire des efforts si la situation est tellement inéluctable ?).

Il faut donner une motivation aux bibliothèques : pénétrer dans l’économie générale du web, cela ne doit pas représenter uniquement un surplus de travail et d’effort, même si la diffusion et la valorisation sont des missions essentielles d’une bibliothèque.

Concernant les bibliothèques, ma proposition sera donc la suivante : il faut développer les « orages sémantiques ». Par cette expression on entend l’ensemble des discussions, polémiques, argumentations autour d’une ressource (auteur, oeuvre, thème, etc.). Dans cette perspective, il faut considérer que chaque ressource disponible en ligne est un paratonnerre dont le but est de capter les polémiques et les discussions dont elle fait l’objet.

Avec cette approche, l’activité de catalogage s’étend au-delà du catalogage des oeuvres puisqu’il couvre le catalogage de des débats sur autour des ressources sur le web. Grâce à ce catalogage des « orages sémantiques », une bibliothèque peut commencer à fournir de nouveaux services, comme par exemple une sorte de « Zeitgeist », un esprit du temps.

Aujourd’hui la Library of Congress archive, plus qu’elle ne catalogue, les messages plubliés sur la plateforme de Twitter. La question qui est posée aux biblitohèques est la suivante : souhaitez vous être condamnées à négocier avec des acteurs privés le catalogage des orages sémantiques via leur plateforme commerciale, ou souhaitez-vous développer vous-même ces dispositifs ? C’est à dire être pro-actif dans la conception de ces dispositifs pour réinventer le catalogage et les services d’une bibliothèque sur le Web. Voulez-vous n’être que des archivistes sous-traitants des plateformes commerciale ou des promoteurs d’une politique économico-culturelle de la contribution ?

Parlant de contribution, je me dois ici de préciser que je ne parle pas de crowdsourcing, de site participatifs ou autres espaces personnalisés de contribution dont pourrait se doter un site web de bibliothèque. Il ne s’agit pas de ici de rajouter des fonctions de tags ou des folksonomies car le squelette de la démarche repose sur l’autorité des métadonnées de la bibliothèque. Le dispositif de captation des orages sémantiques doit reposer sur les acquis des catalogues et des notices d’autorités pour faire la révolution copernicienne du catalogage : elle ne se fait pas en marge de lui ou contre lui mais avec lui, avec ce trésor des métadonnées.

Ne cherchez pas l’outil magique pour faire cela, je crois qu’il n’existe pas, et il reste à faire. Il y a en fait deux dispositifs qui peuvent répondre à cet enjeu des orages sémantiques :

  1. Le premier est un dispositif indirect basé sur l’analyse traces, celui dont je parle ici.
  2. Le deuxième est un dispositif direct basé sur des outils critiques offrant des fonctionnalités d’annotation et de traçabilité des polémiques (le modèle que j’ai en tête étant les outils de gestion des sources dans les projets de développement informatique). De celui ci je ne parle pas dans cette note.

La démarche indirecte doit se construire à partir de plusieurs briques fonctionnelles :

  • du « web analytic » au travers de l’ensemble des services qui permettent d’analyser des traffic de sites web ;
  • du text-mining pour dégager des métadonnées des sources qui pointent vers les ressources exposées de la bibliothèque ;
  • du data-mining
  • des technologies d’indexation
  • bien sûr, si l’effort a été fait d’avoir les données structurées en RDF, la granularité des informations de consultations et de requêtes n’en sera que plus fine et plus facilement exploitable.

Il s’agit donc bien d’un panaché de technologies pour ne pas avoir en sortie un simple hit parade ou un moteur de recommandation à la Amazon. De plus, les expérimentations de publication des statistiques brutes de consultations ont montré que c’est « Mein Kempf » ou le « Kamasutra » qui vont trôner en haut des classements. Je précise également qu’il ne s’agit pas uniquement d’utiliser des informations de consultations, mais surtout des informations provenant de la source des liens qui pointent vers ce lieu de référence qu’est une bibliothèque (pensez ici à BackRub, l’ancêtre de google).

Un petit résumé de ce qui change avec cette approche des orages sémantiques :

  • Les bibliothécaires et conservateurs en « back office » ont un feed-back de ce qui se passe sur le web autour des ressources dont ils ont la gestion. Retour appréciable, me semble-t-il, quand on doit gérer l’évolution de son catalogue : les orages sémantiques placent le bibliothécaire au coeur de son temps, des polémiques et de ce qui fait débat ;
  • La bibliothèque peut ajouter des services innovants sur son site web. Par exemple, je n’irais pas spontanément sur la page d’un auteur sur le site web d’une bibliothèque mais plutôt sur wikipedia à cause de la richesse des informations. Mais si la page en question me donne une « météo culturelle » de cet auteur, alors cela peut changer mes pratiques ;
  • enfin, au delà du ZeitGeist, c’est une extension de la pratique de catalogage qui révolutionne l’activité d’une bibliothèque en la plaçant au coeur de l’économie générale du web.

Je termine par un dernier point car, les bibliothèques, en ces temps budgétaires difficiles, cherchent à augmenter leurs fonds propres, or je serai le premier à acheter une oeuvre (papier ou numérique) qui comprenne un appareil critique issu des informations collectées via le dispositif des orages sémantiques géré par une institution publique telle qu’une bibliothèque. Cela changerait à coup sûr les rapports entre les bibliothèques et les éditeurs, ces derniers ayant beaucoup trop tendance à les mépriser. C’est d’ailleurs quelque chose qui m’a frappé en m’intéressant à la chaîne du livre : l’indifférence et le mépris règne entre les acteurs ce milieu tandis que de nouvelles industries arrivent et raflent la mise, le sourire en coin.

J’espère que les bibliothécaires me pardonneront mon ingérence dans leur domaine de compétence.

Print Friendly
Signaler sur Twitter

{ 10 comments… read them below or add one }

Hugobiwan Zolnir juin 8, 2010 à 9:06

A mon avis, loin de la pardonner, elle va provoquer un orage sémantique 🙂

Répondre

F Bon juin 9, 2010 à 2:08

c’est exprès ce « biblitothèque » en très gros sur la première image ? je ne comprends pas?

Répondre

F Bon juin 9, 2010 à 2:11

un peu avant la 2ème image, un « intertie » qui est aussi un bel orage sémantique entre « inertie » et « interstice » (vire mon comment après correction merci!) – très heureux de cette recherche où tu nous emmènes, coïncide en partie avec questions http://www.tierslivre.net/spip/spip.php?article2163

Répondre

Christian juin 9, 2010 à 8:01

Corrigé, merci.
Pour le « biblitothèque » dans l’image, je m’en étais aperçu mais je l’avais quand même laissé (par flemme de refaire l’image) et pour voir si quelqu’un le verrait. Çà n’a pas traîné ! 🙂

Répondre

Silvae juin 9, 2010 à 12:56

Très intéressant ! Voilà qui est bien plus ambitieux que de faire des catalogues 2.0… Complètement d’accord avec cette approche, qui rappelle un peu la belle approche de « cartographie des controverses » proposée par Bruno Latour http://palimpsestes.fr/textes_divers/la_cartographie_des_controverses.htm

Plurs largement je pense que la question est aussi, après celle de la valeur stratégique des métadonnées des catalogues de bibliothèques, celle du « paratexte » autour des oeuvres objets de données bibliographiques . Non pas seulement COMMENT agréger (certainement avec les technologies que tu mentionnes), mais aussi, même avec des données très visibles sur le web dans un web de données, quelles sources (on peut les créer, mais encore faut-il s’organiser pour le faire, réunir ce qui existe et le rendre exploitable) et sinon quelles logiques d’accès, quels modèles économiques (et quels financements), quelles mutualisations ?

(et personnellement j’adore ce genre « d’ingérences », elles sont des remèdes à l’endogamie !)

Répondre

JM Salaun juin 9, 2010 à 2:24

Salut Christian,

Je ne suis pas sûr d’avoir tout compris, mais je crois en effet que c’est la bonne voie. Un des atouts des professionnels de l’information, trop souvent dénigrer aujourd’hui, c’est de savoir indexer, cataloguer, mettre les bonnes métadonnées. Reste à le faire sous le bon format, à l’ouvrir sur le web et à moissonner de façon intelligente pour enrichir les services.
OCLC propose déjà des services intéressant, rien que par l’interconnexion des catalogues de bibliothèques. Voilà ce que cela donne pour un de vos amis 😉 :
http://www.worldcat.org/identities/lccn-nr94-27791

Il est facile d’imaginer l’intérêt d’un élargissement sur le Web. Il est probable qu’OCLC y travaille déjà, mais je ne suis pas sûr que ce soit très simple.

Répondre

Christian juin 9, 2010 à 5:14

@Silvae : l’approche de Bruno Latour est une excellente référence. Je rappelle que c’est stiegler qui a parlé des « orages sémantiques » (mais dans un sens un peu différent de celui que j’expose ici), dans l’ouvrage que j’ai co-écrit avec lui et Giffard.

@Jean Michel : OCLC, c’est des voleurs de catalogue ! Mais ce qu’ils font est nécessaire et intéressant à suivre. 🙂

Répondre

nchauvat juin 9, 2010 à 6:00

« Ne cherchez pas l’outil magique pour faire cela, je crois qu’il n’existe pas, et il reste à faire. »

On ne part pas de zéro non plus… je saurais par exemple faire une bonne part de ce qui est décrit dans ce billet sur la base de CubicWeb. Je vais d’ailleurs mettre en ligne une démo dans les jours à venir, avec un peu de chance, je parviendrai à déclencher un orage sémantique à son sujet 🙂

Répondre

Hubert Guillaud juin 10, 2010 à 5:18

Je ne disais pas les choses aussi joliment que toi, mais sur le fond, je trouve cela très proche : http://lafeuille.blog.lemonde.fr/2010/04/28/pourquoi-avons-nous-besoin-de-catalogues-20/

Répondre

Christian juin 10, 2010 à 6:21

@Hubert : la forme ainsi que la question sont effectivement les mêmes.
Mais je crois que le fond diffère car les débats sur le « catalogue 2.0 » restent engluées dans des injonctions soit d’ouverture du catalogue (çà c’est nécessaire) soit d’ajout de contributions au catalogue (çà c’est moins nécessaire). Or la métaphore des orages sémantique désigne un nouveau champ du catalogage, non plus celui des oeuvres mais celui des discussions, argumentations et polémiques.
A ce propos la remarque de Silvère sur le texte de Bruno Latour est particulièrement bienvenue.

Je vais le reformuler de la manière suivante : il ne s’agit pas donner aux utilisateurs la possibilité de changer le catalogue, il s’agit d’étendre la périmètre du catalogue pour changer les pratiques des utilisateurs.

Répondre

Leave a Comment

{ 1 trackback }

Previous post:

Next post: