Faut-il se réjouir de l’indexation de Flash ?

La nouvelle a vite fait le tour de la blogosphère : Adobe, Yahoo et Google ont signé un partenariat pour indexer les fichiers flash.
Les premières réactions que j’ai pu lire sont plutôt positives. Mais je reste dubitatif devant cette initiative, et ce pour certaines raisons :

  • d’abord sur le contenu : j’imagine (à tort ?) que la plupart des contenus en flash ne sont pas les textes les plus passionnants du web ; beaucoup de communication marketing me semble-t-il, non ? Ou en tout cas des textes très fragmenté.
  • ensuite, ce contenu, s’il s’avère être de piètre qualité, va énormément rajouter de bruit dans les réponses des moteurs de recherche : quel intérêt pour l’utilisateur de voir les messages publicitaires et marketing contenus dans les flashs se retrouver dans ses résultats de requête ?
  • la logique d’un site en flash n’est pas la même que celle d’un site en HTML, dans le premier elle est événementielle et souvent scénarisée, alors qu’il n’y a pas cette logique d’enchaînement scénarisé dans le HTML. Qui plus est, un évenement sous Flash (car Flash c’est surtout une programmation évenementielle), n’est pas forcément un clic de souris alors que le clic reste le seul moteur hypermedia du web en HTML. Deux logiques d’architecture de l’information et de politique éditoriale différentes donc.
  • donc, comment ces deux logiques de contenu éditorial et d’architecture de l’information vont elles cohabiter dans l’index des moteurs de recherche et les pages de résultats ?

Au dela des contraintes techniques, il y a donc eu un partenariat. Mais pourquoi ce partenariat et pourquoi maintenant ?
L’intérêt d’Adobe semble de prime abord évident : c’est une reconnaissance pour leur format de fichier que de passer à la moulinette de l’indexation des moteurs de recherche. Les documents des interfaces riches vont rejoindre la masse des autres documents qui sont rentrés dans l’économie des moteurs de recherche.

Mais pour Google : pourquoi choisir d’indexer les fichiers Flash et de prendre ainsi le risque de perturber le modèle même de son fonctionnement ?

Google trouve-t-il son intérêt directement dans l’indexation, ou indirectement ? Dit autrement : font-il çà pour quelque chose ou contre quelque chose (ou quelqu’un) ? Vu sous cet angle c’est encore Microsoft le premier visé (décidément). Un Microsoft qui risque de se retrouver à être le seul moteur qui indexe ses interfaces riches en Silverlight.

Mais ce qui m’embête le plus dans cette annnonce, c’est que les architectures orientés ressources, qui sont les architectures de prédilection des trois interfaces riches (GWT, Flex et Silverligth), vont devenir moins incontournables : en effet, pourquoi faire les choses proprement avec une architecture orientée ressource si je peux avoir mon site indexé directement en Flash ? Cette annonce lève à mes yeux une contrainte qui avait du bon et qui avait le mérite de rendre cohérente, et vertueuse, une démarche d’architecture de l’information (et applicative) couplée avec des interfaces riches.

Certes, il est toujours possible – et souhaitable – de faire des architectures orientées ressrources, mais la contrainte de l’indexation étant maintenant partiellement levée, tout cela risque de ralentir la progression de certaines bonnes pratiques.
Autre hyppothèse pour expliquer ce partenariat : Google préfèrerait-il garder le web dans un certain « bordel ambiant » pour rester celui qui l’organise et le monétise pour nous ?
Et je termine avec cette dernière hypothèse : Google souhaite-til indexer les fichiers Flash non pas comme des documents, mais bien comme des applications, c’est à dire avec une logique d’indexation et de restitution bien spécifique (et donc monétisable de manière plus fine et mieux adaptée).

Sur ce sujet, je vous invite à lire deux billets intéressants sur le blog de François Le Droff, puis de consulter une très bonne synthèse d’Aurélien Pelletier sur les technologies RIA.

Vos avis sont les bienvenus pour confronter mes tergiversations à votre vision de la compréhension et des conséquences de cet accord Google / Yahoo! / Adobe sur l’indexation du Flash

Mais les résultats de recherche ont toutes les chance de ne pas être toujours très exploitables, puisqu’il n’y a pas d’URL dans les fichiers flash. Un peu comme si une recherche renvoyait toujours la page d’accueil d’un site…

[Reply]

Bonjour,
Je me demande si ce n’est pas un peu caricatural tout de même d’estimer que le contenu Flash est de « piètre qualité » ? Le Flash ne sert pas seulement aux « messages publicitaires et marketing ».
Cela dit tout ce bruit m’étonne un peu car ça fait au moins 4 ans que Google indexe le texte des animations Flash. Il va seulement mieux le faire à partir de maintenant.
Olivier
PS: j’ai donné mon avis sur mon site ici : http://www.webrankinfo.com/actualites/200807-indexation-texte-animations-flash.htm

[Reply]

@Olivier G.: Il existe une solution assez répandue à ce problème d’URL dans les fichiers flash, qui consiste à doubler la navigation par des liens en dur dans le footer de la page (tout en bas). Les avantages du flash sont ainsi conservés tout en permettant aux moteurs de recherche de détecter les liens et d’accéder aux pages suivantes.

[Reply]

Article un peu extrême : flash ce sont sont aussi des ressources pédagogiques !

[Reply]

@Emmanuelle : pour les ressources pédagogiques, on jugera de leur qualité quand elle remonteront dans les résultats de Google. Wait and see donc.

[Reply]

14 Juil 2008, 9:22
by Gabriel K.

reply

Je me demande si le non dit de ce billet n’est pas la crainte de voir les solutions s’éloigner du web sémantique, ouvert, standard?
(en tout cas c’est ma crainte)

[Reply]

Gabriel K. a raison. Je travail presentement sur un projet appellé SWIS (Semantic Web Indexation System). C’est dans le cadre de mon projet de maitrise à Polytechnique (Mtl). Mon hyopthese: si on indexe nos sites de manière semantique, Google est bon pour les ordures et ses pub aussi. N’importe quel agent imbecile pourra indexer des ressources sur le Web. Non seulement ca mais il pourra aussi indexer DB, services Web, Flash, etc. Il faut vulgariser le Web semantique si nous voulons qu’il se repande. Le Web semantique est la seule manière de sauver l’intelligence artificielle alors mettons-nous au travail si nous voulons un jour ètre penards…:) Super site. Bon courage et bonne chance!

[Reply]

[…] Dans l’immédiat, seul le contenu textuel sera lu, qu’il soit statique ou dynamique. Il fallait s’y attendre vu la récente association d’Adobe et des deux géants de la recherche. Adobe aurait ainsi fourni quelques informations sur son lecteur Flash. Jérôme : Effectivement, les référenceurs doivent accueillir cette annonce avec joie.Petite parenthèse sur le monde dynamique de l’Open Source pour signaler que Nutch intègre depuis longtemps un parser Flash et que suite à la publication des spécifications Flash d’Adobe, Tika (la librairie de manipulation de contenu utilisée par Nutch) devrait prochainement intégrer un parser Flash encore plus performant.Tout ça pour dire que l’intégration du contenu flash dans Google et Yahoo! n’était à mon avis pas un problème technique, mais un problème politique et/ou stratégique. Je rejoint donc le scepticisme et les interrogations de Christian Fauré : “Faut-il se réjouir de l’indexation de Flash ?” […]

 

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.