Digital Studies (2) : Cultural Analytics

by Christian on 3 août, 2011

Après les Digital Humanities, j’aborde à présent les “Cultural Analytics” comme autre champ des Digital Studies.

[L’objet des Cultural Analytics selon la nature, le format, et l’origine des oeuvres]

Si les Digital Humanities sont le fruit de la rencontre entre le traitement automatique des langues —  rendu possible par l’informatique —  avec les textes classiques de la tradition occidentale, les Cultural Analytics, elles, bien que reprenant le principe majeur des Digital Studies qui consiste dynamiser une discipline par son couplage avec l’informatique, débordent largement du cadre initial instauré par les Digital Humanities. Et cela pour au moins trois raisons :

  • Ce ne sont plus seulement des oeuvres textuelles et classiques qui sont ici considérées, mais des oeuvres multi-médias et contemporaines. 
  • De plus, il y a une prévalence non plus d’une oeuvre (ou un corpus relativement délimité d’oeuvres) mais d’une multitude d’oeuvres au travers de leur production, diffusion, accès, consultation et consommation. Ce qui met en avant la dimension réticulaire du milieu technologique dans lequel les oeuvres dites « culturelles » sont étudiées. 
  • Enfin, il y a un éclatement de la notion d’oeuvre en ce sens que l’oeuvre devient le produit de l’agrégation des données et de leur mise en forme. Les data sont la matière première numérique, d’une nouvelle approche du culturel.

Le choix des mots

[Le champ culturel contemporain des Cultural Analytics prend en considération sa production et sa diffusion, les Analytics sont là pour superviser et restituer le tout ]

Commençons par quelques éclairages sur le choix des mots : pourquoi “Cultural” et pourquoi “Analytics” ?

De quelle culture parle-t-on car il ne s’agit plus du champ culturel tel qu’il était compris par les Digital Humanities. Il ne s’agit en effet pas de textes classiques ; il s’agit de la culture d’aujourd’hui, c’est à dire une culture comprise aussi comme culture de masse, et parfois même culture consumériste.

La compréhension de « culture » par les Cultural Analytics est très ouverte, jusqu’à inclure toutes les marchandises et les services de ce marché culturel (par exemple l’entertainment).

Les analytics, eux, font référence aux tableaux et aux schémas de mise en forme de nombreuses données quantitatives utilisées dans le commerce et la science.

  • Dans le commerce, ces analytics sont des outils de prise de décision (dans les entreprises on parle de Business Intelligence) : graphiques de cotation en bourse, camemberts de répartition du chiffre d’affaire, etc.
  • Dans les sciences, on parle d’analytics comme des outils de représentation et d’interprétation de très grandes quantités de données. Ici, la figuration peut être beaucoup plus imagée et moins formelle que les dessins de courbes dans des repères ortho-normés. Voir les images de l’univers et des galaxies qui retraduisent visuellement des données qui sont captées au delà du spectre lumineux que nous pouvons percevoir.

Quand ces analytics deviennent ceux de la culture, il y a dès lors tout un champ de la restitution visuelle qui émerge, avec probablement de nouvelles applications. Quoi qu’il en soit, on comprend bien que l’expression «Cultural Analytics» a une connotation « oximorique », comme c’était d’ailleurs déjà le cas avec les « Digital Humanities ». C’est cette forme de contradiction qui produit l’effet stimulant des démarches de Lev Manovich, icône des « nouveaux medias ».

Les Cultural Analytics selon Lev Manovich

[Distinctions et les spécificités des Digital Studies et des Cultural Analytics selon Lev Manovich]


Si les Digital Humanities étaient un retour aux textes de la tradition – textes numérisés – les Cultural Analytics vont se pencher sur l’analyse de grands corpus de données qui ne sont pas nécessairement des oeuvres au sens noble et classique du terme. Là où les Digital Humanities voulaient faire parler les textes grâce à leur numérisation, les Cultural Analytics se proposent de faire parler non plus seulement les documents numériques mais les données numériques qui ne sont pas partie intégrante d’une oeuvre : c’est avec les données que l’on va faire oeuvre.

[Fragmentation : la visualisation comme restitution synthétique]

Mais de quelles données numériques parle-t-on ? On parle ici de données économiques, scientifiques et commerciales avant que de nouvelles données au caractère plus “culturel” n’apparaissent en masse, et on pense en premier lieu aux contenus publiés par les utilisateurs du Web.

C’est à ces contenus (audio, vidéo et image) que pense Lev Manovich en 2007 lorsqu’il utilise l’expression de « Cultural Analytics » dans son papier “Cultural Analytics: Analysis and Visualization of Large Cultural Data Sets. (PDF)

Sa motivation semble claire : appliquer les techniques de traitement et d’analyse de grands corpus de données scientifiques et économiques au champs culturel. Par “champ culturel” il faut essentiellement comprendre une culture de masse en tant qu’elle est produite et consommée à l’heure du Web. Il faut, dit-il, commencer à penser la culture en tant que :

“data that can be mined and visualized”.

Si la culture était un des derniers lieux où les données, en tant qu’elles permettent le traitement automatique et le calcul, n’avaient pas encore été pénétré, c’est désormais chose faite. Informations, documents et oeuvres doivent laisser une place à la déferlante des data.

La position de Manovich n’est pas pour autant de quitter ou de fuir le champ culturel en laissant la place au données et au calculable, le culturel revient sur le devant de la scène avec la prédominance des arts de la visualisation. Car, finalement, « analytics » signifie analyse ET visualisation.

La temporalité des Cultural Analytics

[La synchronie du temps réel et la diachronie du temps différé (et différant)]

Chez Manovich, l’accent est clairement mis sur la visualisation des grands corpus de data dans une logique de flux souvent associée aux données en temps-réel. Il y a le rêve affirmé de pouvoir voir et surveiller (au sens de monitoring) non seulement les flux d’échanges, de production et de consommation des data et des metadata culturelles mais aussi celles des traces et des comportements autour de cette culture du numérique bien contemporaine. 

[Fantasme du Panopticon]

AT&T Global Network Operations Center

La récurrence du temps réel dans le traitement et la visualisation des data est problématique dans le manifeste de Manovich. Problématique, parce que le temps réel n’est pas le temps de la réflexion requis par les scholars, c’est aussi la raison pour laquelle Manovich s’inscrit plus dans une logique d’expérimentation artistique que dans une logique d’activité scientifique. Connu avant tout comme artiste, il est normal qu’il positionne les Cultural Analytics comme art, et non comme science, de la visualisation des données culturelles.

Tous les services mis en oeuvre par les technologies relationnelles sur le web (services de publication, de partage, de mise en relation, etc.), et notamment les services de réseaux sociaux, sont à ce titre considérés comme des champs d’investigations et d’expérimentations privilégiés. Carsi les Digital Humanities relèvent d’abord de la culture classique et des oeuvres institutionnalisées —  donc top-down —  les Cultural Analytics prennent leur matière première dans les données du champs culturel contemporain, donc plutôt bottom-up.

L’aboutissement est toujours la visualisation qui va être proposée d’un corpus de données qui doit donner à voir les changements au travers de mesures de propagation des activités culturelles en réseau. Les jeux de données doivent être joués dans le temps, les graphiques proposés sont souvent dynamiques et/ou interactifs.

Le statut des Cultural Analytics en question

Un tableau synthétique des distinctions entre les Digital Humanities et les Cultural Analytics :

Ditigal Humanities

Cultural Analytics

Texte

Multimedia

Documents

Données

Ancien

Contemporain

TopDown

BottomUp

Diachronique

Synchronique

La présentation que fait Lev Manovich des Cultural Analytics est à la fois claire et stimulante quand il affirme qu’il s’agit découvrir des modèles et explorer des tendances (“understand patterns and explore trends”).

Mais il ne faut pourtant pas perdre de vue que la perspective dans laquelle se place Manovich, tout professeur qu’il soit, est avant tout celle d’un artiste. Il veut donner à voir par le numérique là où les peintres donnaient à voir dans leur toiles et, à ce titre, n’a pas d’ambition scientifique. Tel le capitaine Kirk dans Star-Trek, il explore en artiste les nouveaux horizons du numérique. Quoi de plus nécessaire quand on sait que le rôle de l’art est de « produire du discernement » (Stiegler).

Aussi, la conception des Cultural Analytics que Manovich propose n’épuise pas le sujet. Il a le sens de la formule et du slogan, tout comme il a du flair (la présente série sur les Digital Studies reprend d’ailleurs ses nomenclatures). Il a le mérite de lancer lui même des tendances qui sont souvent des feuilles de route inaugurales, telles des actes de naissance, avant qu’elles ne deviennent éventuellement des champs disciplinaires avec leur professeurs, étudiants et budgets.

Faire parler les données par l’image

Aujourd’hui, l’intérêt et les travaux sur la visualisation des données n’a d’égal que son pendant scientifique dans l’extraction et le traitement des données. En effet, il n’est pas d’activité dans le traitement de très grand corpus de données qui ne soit pas couplé à une phase de restitution graphique. On peut avoir un aperçu régulier de ces restitutions visuelles sur le site Information Aesthetics, que j’avais déjà évoqué en 2005 à propos de L’art de la mémoire.

Par ailleurs, plusieurs services en ligne comme Many Eyes, Wordle, Flowing Data, et Gapminder permettent de charger des jeux de données et de configurer le rendu selon plusieurs variables.

En informatique également, de nombreux livres : Beautiful visualization, Beautiful Data qui sont la partie émergée et visible de tout un champ de recherche que l’on désigne sous le terme de data analysis.

Je ne développerai pas ce point là mais il est évident le Data Journalism , cette bouée de sauvetage de la profession journalistique, est assurément un mouvement qui s’inscrit pleinement dans le champ des Cultural Analytics.

La sémiologie graphique

Quand il s’agit de graphiques et de visualisations de données, on pourrait s’interroger sur la manière dont, dans notre parcours personnel, nous avons été amené à apprendre certaines formes de cette grammaire visuelle.

[Géographie, la rivière est dans son lit …]

En ce qui me concerne, cela passe par une image qui s’impose immédiatement à moi. C’est celle de ces belles cartes de Paul Vidal de la Blache qui ornaient nos salles de classe d’histoire et de géographie. C’est peut-être ce qui faisait que je percevais les classes d’histoire et de géographie comme étant toujours plus agréables et accueillantes que les autres salles de classe ( à comparer au squelette des salles de sciences naturelles, dont le fait qu’il s’appelle Oscar ne le rendait pas plus sympatique).

C’est là, et dans les manuels correspondants, que les premières cartes et les premiers graphiques nous étaient montrés et présentés comme des outils de travail et d’analyse. 


Il est donc des disciplines qui travaillent naturellement avec le graphique à la fois comme outils d’interprétation, d’analyse, de communication, et de pédagogie : la géographie tout d’abord, puis l’histoire, les sciences économiques et il semble que nous soyons dans une réelle dynamique à laquelle correspond à mes yeux une des ambitions des Cultural Analytics.

A vrai dire, ce qui se joue — l’enjeu — dans les Cultural Analytics, c’est la capacité à « digérer », ou tout simplement à « faire quelque chose avec », les quantités astronomiques de données que de plus en plus d’individus et d’institutions sont en capacité de produire. Si l’on parle souvent de mauvaises exploitations des données (confidentialité, malveillance) ou d’exploitation des données d’une manière générale, il ne faut pas oublier que la réalité « massive » est un manque d’exploitation de ces données.

[ Les rivières de données sont là, mais où sont les moulins à données ? ]

S’il faut faire confiance à Lev Manovich pour explorer en tant qu’artiste les opportunités des « nouveaux média », il faut aussi ancrer Cultural Analytics dans une perspective plus scientifique , ce qui m’amène à remonter à Jacques Bertin et à son ouvrage de référence : La sémiologie graphique.


Un travail écrit à l’apogée du structuralisme en France (en 1965 et publié en 1967), et qui s’inscrit dans le cadre d’une sémiologie générale mais ici appliquée au signe graphique et qui vise explicitement à l’établissement d’une rationalité de l’image, du langage graphique.

Il faut souligner à la fois la dimension prophétique du travail de Jacques Bertin et en même temps les limites inhérentes de son travail au regard du stade d’évolution technologique dans les années 60. Si la question du numérique pointe (notamment au fil des rééditions), la plupart des théories sont proposées sur un fond graphique au sens propre du mot :

“On ne considérera donc que ce qui est représentable sur une feuille plane de papier blanc d’un format moyen, sous un éclairage normal, par tous les moyens graphiques”. (Sémiologie Graphique, p.10)

Les bénéfices de ces graphiques qui font l’objet d’étude de la sémiologie graphique sont bien connus (“une image vaut mille mots”) ; ainsi Bertin distingue-t-il la perception sonore que “ ne dispose que de deux variables sensibles : la variation des sons et le temps” et dont “les systèmes associés sont linéaires et temporels”(Ibid p.7), des perceptions visuelles “qui disposent de trois variables sensibles : la variation des taches et les deux dimensions du plan, et ceci hors du temps”. D’où la propriété essentielle des systèmes destinés à l’oeil :

“… dans un instant de perception, les systèmes linéaires ne nous communiquent qu’un seul son ou signe, tandis que les systèmes spatiaux, dont la graphique, nous communiquent dans le même instant les relations entre trois variables.” (p.7)

Cela veut donc dire que la question d’une grammaire visuelle, c’est à dire des structures — des invariants —  de ce langage des relations de trois variables, doit se poser : qui pourrait croire que l’on puisse développer un tel instrument de travail, une telle technique, sans essayer de constituer une science de la visualisation graphique ?

L’effet le plus surprenant des démarches autour de la Sémiologie Graphique, surtout dans le cadre technologique actuel, c’est qu’elle se joue de la distinction entre le synchronique et le diachronique en nous donnant à voir du multi-chronique. C’est ce que fait l’économiste norvégien Hans Rosling  :

Roger Brunet reprendra et poursuivra dans les années 80 les travaux précurseurs de Jacques Bertin en définissant la chorématique comme un « alphabet de l’espace » dont chaque chorème est une « structure élémentaire de l’espace ».

Print Friendly
Signaler sur Twitter

{ 0 comments… add one now }

Leave a Comment

{ 2 trackbacks }

Previous post:

Next post: