Google a annoncé le lancement de son nouveau modèle d’intelligence artificielle (IA) ultra-puissant appelé Gemini. Ce modèle est conçu pour surpasser les performances des modèles IA actuels sur de nombreux tests. Il pourrait rivaliser avec OpenAI et son GPT-4. Gemini Ultra, la version la plus puissante, elle devrait être disponible courant 2025.
Gemini : le nouveau modèle d’intelligence artificielle de Google
Selon les informations partagées par Google, Gemini serait capable de comprendre du texte, des images et des vidéos et de répondre oralement ou par écrit. La version ultra aurait même réussi à dépasser les humains lors d’un test MMLU mesurant la compréhension et les capacités de raisonnement dans différents domaines.
Une démonstration de cinq minutes montre comment Gemini analyse des objets, identifie des dessins et des vidéos, joue de la musique et répond à des questions complexes tout en justifiant ses réponses.
L’objectif ultime : une intelligence artificielle générale
Tout comme OpenAI, Google vise à créer une intelligence artificielle générale, capable de raisonner aussi bien, voire mieux que les humains. Certains experts pensent qu’il s’agit simplement d’une question de puissance, tandis que d’autres sont moins convaincus, estimant que l’intelligence des machines est limitée par leur faible perception du monde réel. Pour résoudre ce problème, Google envisage d’intégrer son IA dans des robots dotés de capacités sensorielles avancées, notamment le toucher.
Gemini en trois versions pour répondre aux besoins spécifiques
Google prévoit de lancer Gemini en trois versions : une version intermédiaire appelée Gemini Pro, qui alimentera le robot conversationnel Google Bard dès aujourd’hui, mais uniquement en anglais et hors d’Europe. La version Gemini Ultra, plus puissante, disponible à partir de 2024. Une version moins puissante destinée aux professionnels à partir du 13 décembre pour fournir des réponses plus riches et précises aux utilisateurs anglophones. Cependant, cette mise à jour ne sera pas accessible en Europe, au Royaume-Uni et au Canada pour des raisons réglementaires non précisées par Google.
Une nouvelle ère pour les modèles de langage et les applications basées sur l’IA
- Gemini est un modèle multimodal, ce qui signifie qu’il est capable d’analyser et de comprendre des sources d’informations sous diverses formes telles que le texte, les sons, les images ou encore les vidéos.
- Il ouvre la voie à une multitude de produits et services basés sur l’IA générative, permettant aux développeurs et aux entreprises de concevoir des applications tirant parti de ces capacités avancées.
- L’application Voice Recorder de Google, par exemple, pourra maintenant transcrire la parole enregistrée en texte écrit et générer des résumés sans connexion Internet.
Un défi de taille face à l’alliance Microsoft-OpenAI
Longtemps considéré comme un leader dans la recherche fondamentale sur l’intelligence artificielle, Google souhaite être audacieux mais responsable et se positionne comme un challenger face à l’alliance Microsoft-OpenAI. Selon le magazine The Information, Google devait présenter Gemini lors de plusieurs conférences de presse organisées aux États-Unis en décembre, mais cette annonce a finalement été faite hier.
Reste à voir si Gemini est vraiment capable d’éclipser OpenAI et son GPT-4. Les semaines et mois à venir seront déterminants pour mesurer l’impact de ce nouveau modèle IA de Google sur le marché et ses retombées potentielles pour les développeurs, les entreprises et les utilisateurs finaux.
Passionné d’entrepreneuriat et fin connaisseur du monde des affaires à 31 ans, je ne laisse aucune actualité m’échapper. En écrivant des analyses pointues ou des articles plus généraux sur successmag.fr, je partage ma passion et mes découvertes pour vous aider à devenir un entrepreneur à succès !