La société Google a annoncé le lancement d’une nouvelle génération de ses modèles d’IA baptisée “Gemini 2.5 Computer Use”, offrant à son assistant intelligent Gemini des capacités avancées de navigation et d’interaction directe avec les sites web. Cette innovation marque une étape clé vers une nouvelle ère d’automatisation intelligente en ligne.
Selon un rapport publié par The Verge, ce nouveau modèle permet à Gemini de visiter des pages web, de lire leur contenu et d’interagir de manière autonome avec leurs éléments visuels, sans avoir besoin d’interfaces de programmation (API). L’outil peut désormais exécuter des tâches complexes telles que remplir des formulaires, tester des interfaces utilisateurs et collecter des informations directement à partir des sites web.
Dans un billet officiel, Google a présenté les fonctionnalités de Gemini 2.5 à travers une série de vidéos démontrant son utilisation pour analyser des sites, effectuer des actions interactives et récupérer des données en temps réel depuis des sources en ligne.
Cette annonce intervient dans un contexte de forte concurrence entre les géants de l’intelligence artificielle. OpenAI a récemment lancé la fonctionnalité “GPT Apps”, tandis qu’Anthropic a dévoilé des outils similaires dans le cadre de son modèle Claude.
Google affirme que Gemini 2.5 surpasse ses concurrents en matière de performances et de vitesse d’exécution, que ce soit sur ordinateurs ou sur smartphones. L’outil fonctionne via un navigateur intégré, permettant d’interagir avec les sites web sans recourir à un système d’exploitation complet ni à des intégrations externes.
La technologie est actuellement en phase expérimentale et disponible pour les développeurs via Google AI Studio et Vertex AI, avant un déploiement mondial prévu prochainement.
