22/06/11

Retour sur Google recherche d'images similaires: de l'identification au respect de la vie privée

Un premier petit bilan de l'efficacité de ce nouveau google-images qui permet de retrouver des images similaires: gentil pisteur de voleurs d'images sur internet, ou super flicage de nos visages?...
Tout d'abord, du point de vue de l'auteur qui cherche à savoir si ses créations sont diffusées ailleurs sans son autorisation: 
  • Dans ce rôle, le nouveau google-images est un outil plutôt efficace, et même impressionnant par rapport à différents sites de recherches d'images similaires que j'avais eu l'occasion de tester. Il peut retrouver des images similaires même si elles ont été un peu transformées, et a même été capable de retrouver des photos reprises dans un diaporama flash
  • Par contre, il est certain que Google ne retrouve pas toutes les images similaires. Pour qu'il retrouve une image identique à une autre, il faut que cette image soit indexée. Hors, de nombreuses images ne sont tout simplement pas indexées par les moteurs, en particulier les images de forums spécialisés dans le pillage d'images, justement. 
  • De même, et pour rebondir sur le commentaire de Raf, dans mon article de présentation de ce nouveau Google, j'ai effectivement l'impression que Google désindexe plus qu'avant des images trop similaires (duplicate content?). Par exemple, je diffuse mes photos à la fois dans mon blog et dans mon site. J'ai beaucoup moins de "doublons" qu'il y a quelques mois présents dans les résultats de recherche: Google choisit d'indexer la photo de mon site ou celle de mon blog, mais de plus en plus rarement les deux (n'hésitez pas à me dire ce que vous pensez de ce point). 
  • Enfin, une dernière remarque: Ce google images similaires prend en compte la couleur, mais il a l'air de travailler beaucoup sur le contenu textuel: pas sûre qu'il retrouve ma photo de violettes par exemple, si elle est publiée dans un site dédié aux sports automobiles, et qu'aucun élément textuel dans le site, dans l'environnement proche de l'image, et dans le nom de cette photo ne fait référence aux fleurs. (Là encore, hypothèse de ma part: tout complément d'information est le bienvenu). 

Je voulais ensuite aborder l'autre visage de ce super-outil à retrouver les photos volées... 
Utiliser Google images similaires pour retrouver des images volées n'est pas la vocation première de cette fonctionnalité. Cela a normalement été conçu pour proposer des images similaires à n'importe quelle photo afin d'identifier le sujet de cette photo. 
Par exemple, lorsque vous photographiez un lieu remarquable, Google images similaires est censé vous proposer d'autres vues de ce même lieu, afin que vous puissiez l'identifier. 
D'après ce que j'ai pu lire sur le net à ce sujet, là encore, Google fait parfois des prouesses! (Il reconnait et localise tel paysage de montagne, par exemple). J'ai fait une recherche à partir d'une de mes photos de faux de Verzy, et effectivement, Google me renvoie bien aux faux de Verzy! 

J'ai ensuite poursuivi mon test avec une photo de papillon machaon: Google m'a effectivement indiqué la similitude entre mon papillon et la photo de papillon machaon de la page wikipédia éponyme. En théorie, on pourrait donc prendre une photo d'insecte, et Google nous aide à identifier la bête. En pratique, je doute qu'un jour Google fasse la différence entre une mélitée du mélampyre et une mélitée des scabieuses. On peut toujours rêver... 

A partir d'une photo de machaon ailes ouvertes, Google parvient à identifier le papillon...
... mais avec une photo de profil, le moteur perd ses repères!
Quant à espérer qu'il identifie le bousier de ma photo! Google prend des coléoptères pour des hottes de cuisine!

Rêver? Pas vraiment! Car si l'on pousse le raisonnement un peu plus loin, on plonge plutôt en plein cauchemar liberticide! 
Vous me croyez parano? Lisez plutôt... 
De plus en plus de sites nous invitent à utiliser la toile pour partager nos photos privées. Il y a bien sûr l'incontournable facebook, où l'on trouve les photos de l'anniversaire du petit dernier, les photos des vainqueurs du rallye régional, du vernissage de l'exposition de quartier, de la petite fête de départ en retraite du collègue... On partage tout ça sur les murs de FB, on nomme les visages présents sur ces images. Même chose ailleurs: par exemple, Picasa est capable de détecter les visages présents sur les photos, et invite à les identifier. De plus en plus de visages sont ainsi nommés un peu partout sur le net. 
Imaginez un futur proche où il sera possible de télécharger la  photo d'un passant prise à la sauvette en pleine rue avec un simple téléphone portable. Il suffira ensuite de faire une recherche similaire pour demander à maître-google d'identifier cette personne. En quelques clics de souris, vous pourrez alors apprendre beaucoup de choses au sujet de ce parfait inconnu croisé la veille. Je vous laisse imaginer les dérives et les atteintes à la vie privée que cela pourrait engendrer... 

Parano, peut-être, mais aussi consciente que pour l'instant, Google peine encore à identifier les visages et les espèces... Quelques images, histoire de finir sur un sourire:
Étranges résultats: Google assimile ma photo de lérot (rat fruitier) à des photos de labo dans les mêmes teintes (horreur! il y voit un rat de laboratoire!...)

Quant à ce dernier exemple, le résultat se passe de commentaire! (Respect de la vie privée oblige, j'ai masqué les visages de ces dames..., pas celui de mon chien)

Merci beaucoup à tous ceux qui m'ont fait part de leur expérience de ce nouveau google recherche d 'images, que  ce soit dans le fil des commentaires du précédent message, ou par mail.

PS: info blogger: je ne suis pas parvenue à insérer des images dans ce billet de façon classique (depuis l'éditeur d'articles). Un bug bloquait le téléchargement, et j'ai dû les insérer directement en html. J'ignore si ce bug est généralisé, mais si vous êtes dans ce cas, pas de panique.

5 commentaires:

  1. Salut Cathy,
    tu parts dans un film d'anticipation mais je crains que tu n'aies raison. Il faudra peu de temps pour parvenir à la reconnaissance de visages. La dernière image nous rassure un peu et puis c'est franchement marrant mais, comme le signale le Canard Enchaîné de ce matin (22/06/2011), la CNIL ne fait que ralentir un peu les choses et les technologies avancent tellement vite qu'on ne peut qu'avoir un peu peur pour les libertés individuelles.

    RépondreSupprimer
  2. Bonsoir Cathy,
    J'ai eu le même bug que toi ce matin, ça déblogge donc.
    Si j'ai bien compris ton article, ton chien est une blonde. C'est merveilleux l'informatique! ;-)

    RépondreSupprimer
  3. @ Essere: La perte de libertés individuelles est en effet plutôt rapide... On pourrait aussi évoquer les problèmes posés par le maillage des territoires urbains par des caméras.

    @ Darthmagus: Mon chien a très mal pris les résultats de cette recherche ;-)

    RépondreSupprimer
  4. Pour l'instant, cette recherche permet de piquer quelques jolis fous rires !
    Et croisons les doigts pour la suite...

    RépondreSupprimer
  5. @ Pastelle: mieux vaut piquer un fou-rire que de se faire piquer ses photos ;-)

    RépondreSupprimer

ENVIE DE LAISSER UNE TRACE DE VOTRE VISITE OU DE DONNER VOTRE AVIS? N'HÉSITEZ PAS A ÉCRIRE UN COMMENTAIRE.
Merci de votre passage et à bientôt
Cathy Bernot


En savoir plus? Comment laisser un commentaire? Gestion et modération du blog?.