Un obscur nuage de mots-clés

Publié le 24 octobre 2009 (modifié le 10 janvier 2010) par Erwan

[Ill. détail d'un nuage de mots-clés.]Que me présente au juste un nuage de mots-clés ? À quoi correspond sa liste de termes, leur prégnance, leur ordre ? Et finalement, en quoi ce nuage peut-il m’être utile, à moi, simple internaute ? Il n’est pas toujours évident de répondre à de telles questions…

Étant blogueur, je sais combien la première configuration d’un nuage de mots-clés peut être une tâche délicate. Les choix à faire sont souvent nombreux et réclament réflexion et essais. Surtout, du point de vue de l’internaute, la logique sous-jacente d’un nuage de mots-clés peut s’avérer plus ou moins largement hors de portée, et susciter quelques frustrations. Illustration avec cette petite étude d’un nuage de mots-clés (ci-dessous) figurant sur la page d’accueil d’un site américain à la mode, qui propose gratuitement des milliers de fonds d’écran : Desktopnexus.com.

[Ill. reproduction du nuage de mots-clés en bas à droite de la page d'accueil du site Desktopnexus.com. Capture datant de la mi-août 2009.]J’évoque rapidement les motivations d’une telle étude : travaillant depuis longtemps sur un projet de site dédié aux fonds d’écran, je m’intéresse aux diverses modalités de recherche d’un fond d’écran sur Internet. Parmi mes recherches dans ce sens, j’avais repéré le « nuage de mots-clés populaire(s) » (popular tag cloud), sur le site Desktop Nexus, pensant qu’il pourrait m’aider à repérer les thèmes les plus utilisés par ceux qui cherchent des fonds d’écran. [1].

La popularité de quelques mots en question

Toutefois, je me suis vite demandé si j’avais choisi le bon objet d’étude. Un détail me saute aux yeux, et jette immédiatement un gros doute sur la qualité du nuage qui m’est proposé : certains mots-clés ont une initiale en capitale, d’autres non. Pourquoi tant d’internautes se seraient-ils compliqué la vie en saisissant des requêtes avec une capitale initiale ? Qu’en est-il de ceux qui n’ont pas saisi de capitale initiale ? Autre regret, l’ambigüité du nom du nuage (popular tag cloud), qui n’est éclaircie par aucune explication complémentaire : même si nous convenons que vraisemblablement, l’adjectif « populaire » s’accorde avec « mot-clé » (tag), laissé au singulier, plus qu’avec « nuage » (cloud) [2], il nous reste à percer plus précisément en quoi ces cinquante mots-clés à cliquer sont populaires.

Il m’a fallu revenir rapidement sur ce que je m’étais mis en tête, et supposer que les mots les plus prégnants — les plus gros et les plus gras —, le sont peut-être en fait parce qu’ils sont les plus fréquemment associés à un contenu. Le principe est des plus classiques ; on le retrouve sur mon blog, ou encore comme sur la plateforme de stockage et de partage de photos Flickr.com.

Vérifions : le mot-clé le plus prégnant, « 3D », est un signe passeur conduisant à quelques 231 pages de fonds d’écran. Le mot-clé « bleu » (blue), un peu moins prégnant, donne lui accès à seulement 192 pages d’images. L’un des termes les moins prégnants, « mode » (fashion), ne donne accès qu’à 53 pages. De prégnance comparable, « forêt » (forest) donne lui accès à 53 pages également. Considérons l’hypothèse comme — laborieusement — validée : la prégnance des mots-clés est bel et bien liée à la fréquence de l’association de ceux-ci aux images par les contributeurs du site (ceux qui mettent en ligne et indexent des images) [3].

Je m’assombris, déçu au regard de l’intérêt que j’avais hâtivement prêté à ce nuage de mots-clés : a priori, il ne proposerait pas aux chercheurs de fonds d’écran leurs requêtes les plus fréquentes (ce qui eût été intéressant), mais témoignerait donc plutôt du travail d’indexation des contributeurs. Pourtant, les chercheurs d’images sont probablement bien plus nombreux que les membres, même si ces derniers se comptent, sur ce site, par dizaines de milliers [4]. Curieuse « popularité » que celle de ce nuage, qui aurait mérité d’être précisée ; je comprends mieux la cause de mes suppositions premières. Considérant que la figure du chercheur d’images ne coïncide pas nécessairement avec celle du contributeur — qui est nécessairement un des membres — sur ce site, ce nuage me révèle-t-il quelque chose des requêtes des chercheurs ?

[Ill. détail d'une page présentant une image, sur Desktopnexus.com. DR.]Ailleurs sur le site, j’ai remarqué que les attentes des chercheurs semblent prises en compte et restituées sous différentes formes : le nombre de commentaires, de téléchargements, de mises en favoris et de points positifs [5]. Autant de critères de popularité dont le nuage pourrait être un symptôme.

Une énigme texto-nuageuse dont la clé demeure
au fond d’un puits… mais qui peut néanmoins servir

Indépendamment de la taille des mots-clés du nuage, ceux-ci sont une sélection de mots-clés, et non pas la liste exhaustive (contrairement à mon blog, mais comme sur Flickr). On s’en convainc vite en naviguant sur le site : d’autres mots-clés apparaissent en marge dans les différentes rubriques. Je note également que la liste n’est pas proposée dans l’ordre alphabétique (contrairement à mon blog ou à la page de tags de Flickr). Ce corpus et son ordre de présentation pourraient donc constituer une sorte de top 50 des mots-clés associés aux fonds d’écran que les chercheurs préfèreraient, proposés selon l’ordre croissant ou décroissant de popularité. Ce nuage nous laissera-t-il enfin entrevoir un peu de lumière ? La fréquence des associations de mots-clés aux contenus par les contributeurs serait-elle donc un critère secondaire, en définitive, car opérée dans une sélection des requête les plus fréquentes des chercheurs ?

Pas sûr du tout. Il me semble assez peu vraisemblable que « lune » (moon), d’un côté du nuage, ou « pourpre » (purple) de l’autre, soient l’un des mots-clés les plus prisés par les téléchargeurs. L’ombre d’un doute, tout de même, pour la lune, compte tenu d’une part du battage contemporain de mon étude sur les cinquante ans de l’alunissage du premier homme sur notre satellite, et d’autre part du fait que ce mot-clé est immédiatement suivi par d’autres, plus crédibles, comme « mannequin » (model), « femme » (woman) ou « amusant » (funny) [6].

Des doutes, des conjectures, rien de plus. Toutes les méthodes de vérification imaginées m’ont paru contestables à un titre ou à un autre, ou trop chronophages. Même après une enquête assez approfondie, je ne sais donc encore clairement dire ce que propose ce nuage de mots-clés, coiffé d’un titre vague, dépourvu d’explication, proposant une pluie de termes dont on ignore pourquoi eux et pas les autres, et dont l’ordre de présentation demeure incompréhensible. De quoi se dire, après avoir proposé sur ce blog une histoire critique de l’icone de syndication de contenus, que le « web 2.0 » n’est décidément pas une sinécure sur les plans sémantique et ergonomique.

Terminons-en avec ce nuage, en nous gardant de jeter le bébé avec l’eau du bain. Car il me permet tout de même, par exemple, d’accéder à des fonds d’écran selon la couleur dominante (cf. les mots-clés red, green, blue, rose, white, black, purple), et constitue donc une alternative précieuse aux principales rubriques (abstract, aircrafts, animals, anime, etc.). Opaque, mais néanmoins utile, le nuage ; je ne doute pas que malgré cette opacité, ses signes passeurs sont assez fréquemment empruntés par les chercheurs d’images. Un peu comme quand on utilise le moteur de recherche Google, au « Page Rank » pourtant si mystérieux…


Notes :
  1. Mon étude a été réalisée principalement courant août dernier, mais je suis revenu un peu dessus en octobre, au moment où je rédige et publie ce texte. [retour]
  2. On pourrait imaginer qu’un nuage soit qualifié de populaire parce que le webmestre s’est aperçu qu’il est très utilisé par les internautes, par exemple. [retour]
  3. Vérification définitive du qui fait quoi, en proposant moi-même une image : les mots-clés associés à un fond d’écran sont bien le fait des contributeurs, mettant en ligne les fonds d’écran, et non du webmestre. [retour]
  4. Je jette encore un œil sur le site le 24 octobre, et constate que sur les 4050 utilisateurs (users) détectés comme naviguant sur le site en même temps que moi, il y a seulement 65 « membres » reconnus (members) ; tous les autres sont de simples « invités » (guests), or il faut être un membre pour pouvoir proposer une image sur le site. Certes, plusieurs de ces invités peuvent être des membres qui ne se sont pas connectés, et qui donc ne peuvent être reconnus par le système. Mais ce décalage entre membres et invités me semble néanmoins intéressant à relever. [retour]
  5. Cf. plus particulièrement deux types de pages : celle sur laquelle on tombe en cliquant sur l’une des entrées principales, Abstract par exemple (passer la souris sur une image) ; et une page de présentation d’une image. [retour]
  6. Ajout, 25/10/2009. Un nouveau regard sur ce nuage de tags ce jour ne m’aide pas à conforter mon hypothèse ; tout au plus puis-je constater que l’ordre et la composition du nuage ont largement évolué. Les premiers mots en haut du nuage sont (je traduis) : rouge, noir, musique, plage, fleur ; les derniers sont : animaux, photographie, beauté, visage, océan. Il ne me reste qu’à poser la question au webmaster. [retour]

Articles comparables sur le blog :

 Mots-clés associés à ce billet : analyse, ergonomie, informatique, internet, sémiologie, wallpaper



 Billets du blog |  Commentaires | Accueil

Ajouter un commentaire
Sur la gestion des commentaires, lire la page A propos.




Votre commentaire