Flickr et son interestingness : jeu de dupes? (1/2)
Publié le 8 janvier 2007 (modifié le 4 novembre 2009) par Erwan
Comment amène-t-on l’utilisateur de Flickr.com à prendre en compte l’algorithme d’intérêt (Interestingness) et pourquoi ? Après avoir porté sur ce site un regard d’utilisateur-joueur, je tente d’appréhender les intérêts de cet algorithme pour Yahoo!. Première partie.
Pour commencer, rappelons le contexte : Google a racheté le logiciel de gestion d’images Picasa en juin 2004, et propose depuis le printemps 2006 un outil d’hébergement de photos en ligne, Picasa Albums Web. Le rachat par Yahoo! en mars 2005 de Ludicorp, créateur canadien de Flickr, est intervenu quelques mois seulement avant l’annonce le 1er août, sur le blog Flickr, de la mise en place de l’algorithme d’intérêt. Flickr indiquait alors que la création de cet algorithme avait pris beaucoup de temps (« A long time in the making »), ce qui laisse supposer que Yahoo! a acquis Ludicorp et Flickr en connaissant ce projet. Enfin, il est connu depuis quelques mois que Yahoo! tente maintenant de faire breveter le principe de cet algorithme.
La guerre fait rage entre Google et Yahoo! autour de la gestion des images en ligne sur Internet. L’algorithme d’intérêt de Flickr-Yahoo!, assimilable au célèbre Page Rank de Google, sert aujourd’hui à faire le tri parmi plus de 250 millions d’images… dont les miennes. Que cache, si j’ose dire, l’intérêt que suscite cet algorithme d’intérêt ? Cherche-t-on à me manipuler, comme je le ressens confusément ? Voilà qui explique que je me penche sur ce sujet.
Omniprésence de l’interestingness
Absente au départ de l’aventure Flickr, commencée en ligne en février 2004, la notion d’« intérêt » est aujourd’hui très présente sur le site (c’est là un autre élément qui a piqué ma curiosité). Pour en prendre la mesure, j’ai relevé quelques-unes de ses nombreuses traces aujourd’hui, sous différentes formes (NB : compte tenu du rythme des évolutions sur Flickr, cet inventaire risque d’être assez rapidement obsolète…):
Sur la page d’accueil. Je parle ici de la page sur laquelle arrivent les nouveaux venus, ou les utilisateurs qui se sont « délogués » (la page d’accueil de l’inscrit identifié est différente). Il est déjà question de la notion d’intérêt sur cette page. Sous le lien textuel « Explorez Flickr », qui renvoie à la page d’accueil de la rubrique Explore, on peut lire (c’est moi qui souligne) : « Naviguez parmi les photos les plus intéressantes partagées depuis les sept derniers jours ». Des liens voisins renvoient eux à la page des images les plus « intéressantes » des derniers jours (Last 7 Days Interesting).
Dans la rubrique Explore. L’internaute cliquant sur Explore Flickr est alors conduit vers la page d’accueil de la rubrique Explore, où de nombreuses façons de surfer et faire ses recherches dans Flickr lui sont proposées. Mais en premier lieu, l’internaute est invité à se pencher sur cette notion d’intérêt. Dès le haut de la page, un texte l’informe en Anglais que « les labos Flickr ont travaillé dur pour créer une façon de vous montrer quelques-unes des plus étonnantes photos sur Flickr. Nous aimons à l’appeler intérêt ». Le mot « intérêt » est ici un lien vers la page Interestingness, dont il a été question dans le billet précédent. L’intérêt, sur Flickr, consisterait à utiliser une combinaison mystérieuse d’informations pour sélectionner ou présenter des images selon un principe de popularité. C’est cette combinaison, cet algorithme, qui présiderait à l’entrée de certaines images dans le calendrier (Calendar) et sur la page présentant les images les plus « intéressantes » des derniers jours (Last 7 Days Interesting). Ces espaces font un peu penser à des « musées », contenant une sélection d’images. En dehors de ces espaces, sur de nombreuses pages accessibles entre autres par la rubrique Explore, les images peuvent être classées par l’internaute, au choix, selon un ordre chronologique ou un ordre d’« intérêt » [1]. C’est le cas par exemple lorsqu’on fait une recherche par tags.
Sur les pages de « flux photo » (Photostream). Il s’agit de ces pages affichant par ordre antichrolonogique une série d’images mises en ligne par chaque détenteur d’un compte Flickr (exemple). On retrouve en haut de ces pages un accès à la rubrique Explore où il est amplement question d’intérêt, comme on a pu le constater. Si vous êtes sur le flux de vos propres images, une rubrique « Populaire » (Popular) vous permet de retrouver vos photos classées par défaut par ordre de leur « intérêt ». Trois paramètres sont associés à chaque image, comme pour en justifier le classement ici : le nombre de fois où la « page image » (lire ci-dessous) a été vue, le nombre de fois où elle a été classée « favorite » par d’autres détenteurs d’un compte Flickr, et le nombre de commentaires laissés par ces derniers sous l’image. Enfin, toujours si vous êtes sur votre propre flux d’images, vous pouvez observer que deux des paramètres pris en compte par l’algorithme de Flickr sont systématiquement associés à chaque photo : le nombre de commentaires et le nombre de visites d’une « page image » (si vous n’êtes pas sur votre propre flux, ou si vous êtes délogué, seul le nombre de commentaires apparaît).
Sur les « pages image » (exemple). Ce sont les pages sur lesquelles figurent à la fois l’image les nombreuses informations qui lui sont associées : titre, légende, mots-clés (tags), flux et groupes d’appartenance, données Exif, droits d’auteur, caractère privé ou public… Précisons que ces informations sont généralement optionnelles ; elles peuvent parfois exister mais être cachées ; elles peuvent parfois être plus ou moins précisément renseignées. On trouve également sur chacune de ces pages les commentaires, le nombre de fois ou la page image a été vue, et le nombre de fois où elle a été définie comme favorite par d’autres utilisateurs. Autant d’informations dont le détenteur de compte peut deviner, s’il a consulté la rubrique Popular, qu’elles sont une incidence sur l’« intérêt » attribué à leurs images.
Ce mystère ludique qui met l’abonné à l’indexation
La présence ici encore de ces informations, étroitement associées à l’image, n’est pas neutre. Aujourd’hui, dans la plupart des cas, pour connaître les statistiques de visite d’un blog ou d’un autre type de site, il faut que le webmestre se rende dans une rubrique autonome de son gestionnaire de contenus, voire fasse appel à un site extérieur spécialisé. L’omniprésence de toutes ces informations sur Flickr a certainement pour objectif d’amener l’internaute, et notamment le détenteur d’un compte (qui y est particulièrement exposé), à y prêter attention, à en tenir compte.
Oui, la notion d’intérêt est omniprésente sur Flickr. Que ce soit en phase de découverte du site, lors de la recherche d’image, ou encore après l’inscription, dans le cadre de la consultation des images et de l’évolution de leurs tags sociaux par le détenteur d’un compte. Que ce soit en tant que sujet, en tant qu’algorithme utilisable pour trier ou filtrer les images, ou encore à travers le rappel des informations dont on nous dit - ou laisse entendre - qu’il se nourrit. Ceci, combiné au mystère qui entoure la formule précise de l’algorithme ; combiné aussi à l’existence de ce « musée » qu’est le Calendar (et la page Last 7 Days), a de quoi inciter de nombreux détenteurs de compte à s’y pencher puis éventuellement à se lancer dans la compétition technico-sociale évoquée dans le précédent billet.
Pourquoi avoir créé cet algorithme d’intérêt, et en faire un jouet ludique et mystérieux si présent sur Flickr ? Commençons par la piste qui est peut-être la plus évidente. Dans une interview du 9 décembre 2006 accordée au site Observatoire critique des ressources numériques en histoire de l’art et archéologie, André Gunthert rappelle que la capacité de circuler, d’archiver, de rechercher et de hiérarchiser l’information sur le Web repose « sur la base d’un principe très simple, le repérage de caractères écrits. Or, il n’y a pas de ‘langage’ de l’image. Jusqu’à présent, les fichiers graphiques ont été pour l’outil informatique autant de blocs opaques in-identifiables […]. Sur Flickr, l’usage du tag s’est adapté à l’opacité des fichiers images, en allant au-devant de la recherche […] ».
La multiplicité des informations associées, dont le tag est un des nombreux types, est l’un des grands atouts de Flickr s’agissant de rechercher des images sur le Web. Mais pour fonctionner à plein, il faut que les détenteurs de compte - les auteurs-éditeurs comme les visiteurs inscrits - effectuent l’insertion de ces informations, lorsque cela ne peut se faire automatiquement. En l’absence de ce travail, nul ne peut savoir la nature ou l’« intérêt » de ce que l’image (re)présente ; on peut donc difficilement donner la possibilité de la trouver. Et les fonctionnalités de Flickr ne peuvent que brasser du vide. Alors qu’un texte contient en lui des combinaisons de caractères écrits susceptibles de permettre de le trouver et d’en connaître le contenu, tout ou presque est à faire avec un document numérique mis en ligne, tel qu’une image ou un document fait de sons et/ou d’images.
La ludique et mystérieuse notion d’ « intérêt », très présente sur Flickr, est selon moi un moyen habile de motiver certains détenteurs de compte à associer des informations aux images. La puissante application interne Organize, mise à la disposition des détenteurs de compte, est symptomatique de l’importance accordée à cette gamme de tâches par les concepteurs de Flickr. Elle permet, entre autres, de traiter l’ajout de tags par lots d’images.
La ludique et mystérieuse notion d’« intérêt », très présente sur Flickr, est selon moi un moyen habile de motiver certains détenteurs de compte à associer des informations aux images. Ceci en vue, entre autres, de permettre le référencement des images dans le site et d’affirmer les valeurs ajoutées fonctionnelles de ce dernier.
Et l’une des raisons du mystère entretenu autour du fonctionnement précis de cet algorithme d’intérêt est peut-être qu’il incite les auteurs-éditeurs à ajouter de nombreuses informations. Ceci sans en délaisser certaines, qui seraient moins importantes voire inutiles s’agissant d’augmenter l’« intérêt » de leurs images. Puisqu’on ne sait pas précisément quelles informations comptent, en mettre le plus possible fait partie des idées qui viendront probablement à l’esprit du détenteur de compte.
On croit deviner là, en partie, la valeur de l’algorithme d’intérêt pour une entreprise comme Yahoo! : réussir, par le jeu social, à faire jouer/travailler les internautes pour qu’ils ajoutent à des documents non textuels des informations textuelles ou des actions enregistrables et quantifiables (telles que des clics), permettant à la fois de les trouver et de définir aussi leur « intérêt ». Ceci permet à Yahoo!, dans la foulée, de proposer des réponses iconiques plus pertinentes que Google Recherche d’Images. Ou de rediriger bien vite les internautes de Google vers des pages Yahoo! [2].
Susciter l’intérêt, mais rester financièrement désintéressé
Les divers outils interactifs de Flickr et la dimension ludique de son algorithme d’intérêt permettent d’obtenir de nombre de détenteurs de compte particulièrement « intéressants » ce gigantesque effort humain, sans contrepartie autre que sociale. Le principe social en vigueur sur Flickr via la notion d’intérêt peut paraître un jeu innocent, je le suppose en fait très addictif. Car contrairement à la plupart des blogs, où recueillir des commentaires et faire classer un de ses billets comme favori n’apporte en soi que peu de choses à la promotion dudit billet sur Internet, ces opérations s’avèrent très utiles à votre notoriété sur Flickr. Créer une motivation, voire faire une addiction de ces tâches que sont la fourniture d’images et leur indexation, là réside peut-être tout le « génie » de l’algorithme d’intérêt.
Il semble aussi que de nombreux détenteurs de compte soient très joueurs dans l’âme, très réceptifs à la nouveauté sur Internet, ce qu’ont apparemment compris les créateurs de Flickr. L’expansion.com se fait ainsi l’écho du grand succès du système de géolocalisation d’images mis en place sur Flickr en août 2006 : « En 24 heures, 1,2 million de photos ont […] été géolocalisées, objectif que Flickr pensait atteindre, au mieux, en deux semaines ». Ce service de géolocalisation présente-t-il un véritable intérêt, autre que ludique, pour tous les détenteurs de comptes qui ont utilisé ce service ? Personnellement, je ne le crois pas, mais cela ne m’a pas empêché de tester ce service… La géolocalisation, une précision de plus, associée aux images, et permettant à Yahoo! d’être un peu plus compétitif par rapport à Google ?
On peut se demander si la dimension ludique et sociale de Flickr, ainsi que les limites fonctionnelles qui ont été données à ce site, ne contribuent pas fortement à confiner les détenteurs de compte dans un amateurisme et dans une logique de générosité aujourd’hui surtout profitables à Yahoo!. Le site semble conçu de façon à (leur) faire oublier que leurs productions et leur travail d’étiquetage peuvent avoir une certaine valeur marchande. Les détenteurs de compte sont de vraies « petites mains » très productives et réactives, pourtant, pas question pour eux de tirer un quelconque bénéfice pécuniaire dans l’économie du site. Yahoo! a sans doute intérêt à ce que les détenteurs de compte restent le plus longtemps possible dans l’amateuro-ludique, tandis que l’entreprise se charge du volet professionnelo-lucratif…
Cette donne va-t-elle paraître durablement équitable aux yeux de nombre de détenteurs de compte, dont le succès social peut tout de même finir par donner des idées d’émancipation (semi-)professionnelle ? Comme en témoignent les informations juridiques Creative Commons, associées par de nombreux détenteurs de compte à leurs images, beaucoup d’entre eux ne souhaitent pas faire commerce de leurs images aujourd’hui. Mais peut-être en partie parce qu’ils n’y croient pas, parce qu’ils n’y pensent pas, parce que Flickr n’en donne pas l’idée. Cela pourrait donc n’être en fait qu’un demi-choix. Que penser du fait que Yahoo! tire de son côté, on s’en doute, un bénéfice certain de Flickr ?
On trouve des traces ce genre de questionnement sur Internet, par exemple à travers ce billet d’un certain Ryan datant de 2005, et dont le titre est à peu près : « Comment ressentez-vous le fait qu’un autre se fasse de l’argent avec vos contenus ? ». Ryan rapporte les propos d’Anil, qui remarque que l’algorithme de l’intérêt de Flickr « ne rapporte pas d’argent. En tout cas pas pour l’instant. Les utilisateurs […] voient des pubs autour de mes photos, mais Yahoo! ne partage pas les bénéfices avec moi […] ». Et Ryan de flairer que cette donne « va changer dès que disparaîtra le rideau de fumée qui entoure cette nouvelle expérience de média collectif ».
Les commentaires sous le billet montrent que son avis n’était pas très partagé. Il lui a été rappelé par exemple qu’un service lui est délivré gratuitement, que d’autres sites existent qui permettent, eux, de gagner de l’argent avec ses photos, etc. Pourtant, a priori rien ne semble vraiment s’opposer à la délivrance d’un tel service sur Flickr. Le site DeviantART, lui, va en tout cas dans ce sens.
La question de la commercialisation des images sur Flickr, sous une forme ou sous une autre, n’est sans doute pas si saugrenue qu’il pourrait y paraître à la lecture des réponses faites à Ryan. Elle a même été posée aux fondateurs de Flickr, dans une interview de 01net.com datée du 26 septembre 2006. Dans leur réponse, Caterina Fake et Stewart Butterfield invoquent la protection des amateurs, qui « ne savent pas nécessairement ni comment ni combien les vendre ». Ils concluent en indiquant qu’un tel service « qui faciliterait ce genre de transactions » est « envisageable » mais reste « encore très hypothétique ».
Au vu du succès actuel de Flickr, il n’y a pas de raison de se presser (!). Toutefois, en parlant de protection, le système Flickr protège-t-il suffisamment les détenteurs de compte du téléchargement de leurs images, et de leur utilisation, contre leur gré ? L’innocence ludique et la générosité qui semblent entretenues sur Flickr contribuent à rendre des millions d’images à la fois disponibles et faciles à trouver sur Internet. De quoi attirer de nombreux visiteurs moins innocents qui connaissent la manne Flickr. Autant de visiteurs de plus pour les publicités de Yahoo!…
Suite de l’article : ici.
Notes :
- Il est souvent possible d’afficher une liste d’images selon leur degré de pertinence (« Most relevant »). [retour]
- (Ajout, 20/09/2007) Je vois une confirmation de cette hypothèse à travers un jeu en ligne lancé par Google à la fin fin août ou au début de septembre 2006 : Image Labeler. Toutefois la ficelle du travail d’indexation ludique, bien plus grosse ici, a vite été dénoncée par la blogosphère : « Google recherche documentalistes bénévoles » ; « Travaillez pour Google! » ; «Google Image Labeler vous fait bosser »… [retour]
Articles comparables sur le blog :

Billets du blog | 