Le mode IA de Google comprend et analyse désormais vos images

Rédigé le 15/04/2025
L' Articlophile


La recherche visuelle franchit aujourd'hui une nouvelle étape majeure avec l'intégration des capacités multimodales au mode IA de Google. Cette avancée technologique permet désormais aux utilisateurs d'interagir avec leurs images d'une manière inédite, en posant des questions précises et complexes sur leur contenu.

"Les utilisateurs peuvent maintenant obtenir une réponse riche et complète avec des liens pour approfondir chaque aspect de leur recherche visuelle", explique Robby Stein, vice-président des produits pour Google Search. Cette innovation repose sur une version personnalisée de Gemini, combinée aux capacités de Google Lens, permettant une compréhension approfondie des images.

Le système utilise une approche sophistiquée appelée "query fan-out" qui analyse simultanément l'image dans sa globalité et ses composants individuels. Selon Google, cette technique permet d'obtenir des réponses "incroyablement nuancées et contextuellement pertinentes", dépassant largement les capacités des recherches traditionnelles.

Pour illustrer cette évolution, prenons l'exemple d'une photo d'étagère de livres. L'intelligence artificielle peut non seulement identifier chaque ouvrage, mais aussi fournir des recommandations personnalisées basées sur les titres présents. Les utilisateurs peuvent même affiner leurs recherches avec des questions spécifiques comme "Parmi ces suggestions, quelle est la lecture la plus rapide ?", comme le rapporte TechCrunch.

L'accès à cette technologie s'élargit progressivement. Initialement réservée aux abonnés Google One AI Premium, la fonctionnalité devient accessible à "des millions d'utilisateurs supplémentaires" via Labs aux États-Unis. Les premiers retours sont particulièrement encourageants, avec des utilisateurs qui formulent des requêtes deux fois plus élaborées que dans les recherches classiques.

Cette évolution représente un pas décisif dans la démocratisation de l'intelligence artificielle appliquée à la recherche visuelle. Disponible sur l'application Google pour Android et iOS, elle transforme fondamentalement notre façon d'interagir avec les images numériques. "Nous observons que les utilisateurs exploitent cette fonctionnalité pour des tâches de plus en plus complexes, de la comparaison de produits à la planification de voyages", souligne Google dans son blog officiel.

Face à la concurrence de ChatGPT Search et Perplexity, Google affirme sa position de leader en proposant une expérience de recherche plus intuitive et interactive. Cette innovation marque un tournant significatif dans l'évolution des moteurs de recherche, ouvrant la voie à une nouvelle ère d'interaction entre l'homme et la machine.