Google accélère la course aux agents IA en lançant Gemini 2.0
Les modèles de Gemini 2.0 sont censés permettre de créer des agents IA capables de répondre aux questions des utilisateurs et d'agir en leur nom. Selon le patron de Google, Sundar Pichai, Gemini 2.0 doit ouvrir «une nouvelle ère» de l'IA générativeDepuis le lancement de ChatGPT par OpenAI il y a deux ans, les géants des technologies sont engagés dans une course aux modèles d'IA générative toujours plus performants. Google veut s'imposer en annonçant mercredi l'arrivée de Gemini 2.0, une nouvelle famille de modèles d'intelligence artificielle (IA) générative, censés permettre de créer des agents IA capables, non seulement de répondre aux questions des utilisateurs, mais aussi d'agir en leur nom.«Ce n'est que le tout début», a assuré sur X Demis Hassabis, patron du labo d'IA de Google, DeepMind, et prix Nobel de chimie. «2025 sera l'année des agents IA.»Le Graal de la Silicon Valley, ce sont désormais ces «agents», quand la machine devient une sorte de secrétaire omniscient, disponible à toute heure et capable d'exécuter de nombreuses tâches, des messages à envoyer aux courses sur Internet. A ce sujet: Les agents autonomes, la nouvelle tendance dans l’IA générativeSelon le patron de Google, Sundar Pichai, Gemini 2.0 doit ouvrir «une nouvelle ère» de l'IA générative, qui facilitera directement la vie des usagers au quotidien. «Gemini 2.0, c'est la capacité à rendre l'information bien plus utile», a-t-il souligné dans une note de blog annonçant Gemini 2.0, insistant sur la capacité du nouveau modèle à comprendre un contexte, anticiper et prendre des décisions, «sous votre supervision». Today we announced Gemini 2.0, our most capable AI model yet. With new advances in multimodality — like native image and audio output — and native tool use, it will enable us to build new AI agents that bring us closer to our vision of a universal assistant. pic.twitter.com/SuS2OZOSzT— Google (@Google) December 11, 2024 Plusieurs projets en cours Les utilisateurs de Gemini sur ordinateur peuvent désormais tester Gemini 2.0 Flash, l'un des modèles de la nouvelle famille, tandis qu'une version expérimentale et multimodale a été mise à disposition des développeurs. Certains ont d'ores et déjà publié des vidéos montrant leurs échanges avec le service. La multimodalité permet, par exemple, de montrer des objets à l'IA, qui peut les analyser et répondre à des questions à leur sujet, en temps réel et à l'oral. Notre Bible de l'IA: Voici les pouvoirs de plus en plus puissants proposés par l’intelligence artificielleDemis Hassabis a précisé que, grâce à Gemini 2.0, ses équipes avancent sur plusieurs projets. Notamment «Project Astra, notre vision pour un assistant IA universel», «Project Mariner» pour améliorer les interactions entre humains et agents numériques, et «Jules», un outil pour les codeurs.Dans une vidéo publiée sur X par Google, Jaclyn Konzelmann, une cheffe de projet, montre comment l'agent «Project Mariner» peut extraire des données d'un document, et, à la demande, trouver des informations complémentaires. L'agent navigue ainsi sur Internet de façon autonome, décidant quels mots-clefs entrer dans la barre de recherche, sur quels liens cliquer, etc. Il peut aussi sélectionner des produits à acheter, mais pas cliquer sur le bouton pour finaliser l'achat. Face à la menace, Google a répondu avec les «AI Overviews» Google compte intégrer Gemini 2.0 progressivement dans sa gamme de différents produits, du moteur de recherche aux applications mobiles, dans plusieurs langues. «Aucun produit n'a été autant transformé par l'IA que la recherche», note le géant californien sur son blog.L'IA générative constitue, en effet, la première menace de taille à son coeur de métier, la vente de publicités en ligne, depuis que Google est devenu synonyme de recherche sur Internet. La technologie permet de plus en plus de contourner cette tâche, en posant directement une question à un modèle d'IA. Lire aussi: Avec son moteur de recherche, OpenAI offre un début de concurrence à GoogleGoogle a réagi en lançant les «AI Overviews»: le moteur répond aux requêtes avec une réponse rédigée et différentes options, avant la traditionnelle liste de liens. Le service touche désormais 1 milliard de personnes, s'est félicitée l'entreprise, promettant d'ajouter bientôt «les capacités de raisonnement avancées de Gemini 2.0».Meta (Facebook, Instagram), Microsoft, OpenAI, Google et, plus récemment, Apple et Amazon ont tous investi des sommes astronomiques dans le développement d'IA génératives susceptibles de faciliter les tâches de la vie quotidienne et d'améliorer la productivité. Ils ont en ligne de mire un agent IA universel, qui interagirait au nom des personnes avec leurs logiciels et applications.
Les modèles de Gemini 2.0 sont censés permettre de créer des agents IA capables de répondre aux questions des utilisateurs et d'agir en leur nom. Selon le patron de Google, Sundar Pichai, Gemini 2.0 doit ouvrir «une nouvelle ère» de l'IA générative
Depuis le lancement de ChatGPT par OpenAI il y a deux ans, les géants des technologies sont engagés dans une course aux modèles d'IA générative toujours plus performants. Google veut s'imposer en annonçant mercredi l'arrivée de Gemini 2.0, une nouvelle famille de modèles d'intelligence artificielle (IA) générative, censés permettre de créer des agents IA capables, non seulement de répondre aux questions des utilisateurs, mais aussi d'agir en leur nom.
«Ce n'est que le tout début», a assuré sur X Demis Hassabis, patron du labo d'IA de Google, DeepMind, et prix Nobel de chimie. «2025 sera l'année des agents IA.»
Le Graal de la Silicon Valley, ce sont désormais ces «agents», quand la machine devient une sorte de secrétaire omniscient, disponible à toute heure et capable d'exécuter de nombreuses tâches, des messages à envoyer aux courses sur Internet.
Selon le patron de Google, Sundar Pichai, Gemini 2.0 doit ouvrir «une nouvelle ère» de l'IA générative, qui facilitera directement la vie des usagers au quotidien. «Gemini 2.0, c'est la capacité à rendre l'information bien plus utile», a-t-il souligné dans une note de blog annonçant Gemini 2.0, insistant sur la capacité du nouveau modèle à comprendre un contexte, anticiper et prendre des décisions, «sous votre supervision».
Today we announced Gemini 2.0, our most capable AI model yet. With new advances in multimodality — like native image and audio output — and native tool use, it will enable us to build new AI agents that bring us closer to our vision of a universal assistant. pic.twitter.com/SuS2OZOSzT— Google (@Google) December 11, 2024
Plusieurs projets en cours
Les utilisateurs de Gemini sur ordinateur peuvent désormais tester Gemini 2.0 Flash, l'un des modèles de la nouvelle famille, tandis qu'une version expérimentale et multimodale a été mise à disposition des développeurs. Certains ont d'ores et déjà publié des vidéos montrant leurs échanges avec le service. La multimodalité permet, par exemple, de montrer des objets à l'IA, qui peut les analyser et répondre à des questions à leur sujet, en temps réel et à l'oral.
Demis Hassabis a précisé que, grâce à Gemini 2.0, ses équipes avancent sur plusieurs projets. Notamment «Project Astra, notre vision pour un assistant IA universel», «Project Mariner» pour améliorer les interactions entre humains et agents numériques, et «Jules», un outil pour les codeurs.
Dans une vidéo publiée sur X par Google, Jaclyn Konzelmann, une cheffe de projet, montre comment l'agent «Project Mariner» peut extraire des données d'un document, et, à la demande, trouver des informations complémentaires. L'agent navigue ainsi sur Internet de façon autonome, décidant quels mots-clefs entrer dans la barre de recherche, sur quels liens cliquer, etc. Il peut aussi sélectionner des produits à acheter, mais pas cliquer sur le bouton pour finaliser l'achat.
Face à la menace, Google a répondu avec les «AI Overviews»
Google compte intégrer Gemini 2.0 progressivement dans sa gamme de différents produits, du moteur de recherche aux applications mobiles, dans plusieurs langues. «Aucun produit n'a été autant transformé par l'IA que la recherche», note le géant californien sur son blog.
L'IA générative constitue, en effet, la première menace de taille à son coeur de métier, la vente de publicités en ligne, depuis que Google est devenu synonyme de recherche sur Internet. La technologie permet de plus en plus de contourner cette tâche, en posant directement une question à un modèle d'IA.
Google a réagi en lançant les «AI Overviews»: le moteur répond aux requêtes avec une réponse rédigée et différentes options, avant la traditionnelle liste de liens. Le service touche désormais 1 milliard de personnes, s'est félicitée l'entreprise, promettant d'ajouter bientôt «les capacités de raisonnement avancées de Gemini 2.0».
Meta (Facebook, Instagram), Microsoft, OpenAI, Google et, plus récemment, Apple et Amazon ont tous investi des sommes astronomiques dans le développement d'IA génératives susceptibles de faciliter les tâches de la vie quotidienne et d'améliorer la productivité. Ils ont en ligne de mire un agent IA universel, qui interagirait au nom des personnes avec leurs logiciels et applications.