Modèles


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

Notre modèle au meilleur rapport prix/performances pour les tâches à faible latence et à fort volume qui nécessitent un raisonnement.

Nano Banana

Génération et retouche d'images natives de pointe, conçues pour des workflows créatifs rapides.

Aperçu de Gemini 2.5 Flash Live

Optimisé pour les agents conversationnels en temps réel avec streaming audio natif en moins d'une seconde.

Aperçu de Gemini 2.5 Flash TTS

Génération audio de synthèse vocale contrôlable, avec un contrôle précis du style et du rythme.


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

Le modèle multimodal le plus rapide et le plus économique de la famille 2.5.


Gemini 2.5 Pro

Gemini 2.5 Pro

Notre modèle le plus avancé pour les tâches complexes, avec des capacités de raisonnement et de codage approfondies.

Aperçu de Gemini 2.5 Pro TTS

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.


Modèles audio

Cette section contient tous les modèles audio, y compris ceux qui peuvent déjà être répertoriés dans d'autres sections.

Aperçu de Gemini 3.1 Flash Live

Notre modèle audio-vers-audio (A2A) de haute qualité et à faible latence, conçu pour les applications d'IA de dialogue et vocales en temps réel.

Aperçu de Gemini 3.1 Flash TTS

Génération vocale puissante et à faible latence, avec des sorties naturelles, des requêtes orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.

Aperçu de Gemini 2.5 Flash Live

Notre modèle d'API Live phare pour les agents vocaux et vidéo bidirectionnels à faible latence avec raisonnement audio natif.

Aperçu de Gemini 2.5 Flash TTS

Synthèse vocale rapide et contrôlable pour les applications à faible latence et économiques, et les assistants en temps réel.

Aperçu de Gemini 2.5 Pro TTS

Synthèse vocale haute fidélité optimisée pour la qualité dans les workflows structurés tels que les podcasts et les livres audio.


Modèles de génération de contenu

Cette section contient tous les modèles de génération de contenu, y compris ceux qui peuvent déjà être répertoriés dans d'autres sections.

Aperçu de Nano Banana 2

Création visuelle à l'échelle de la production très efficace, combinant l'intelligence de la série Gemini 3 à des vitesses de génération ultra-rapides.

Aperçu de Veo 3.1

Génération de vidéos cinématiques de pointe avec des commandes créatives avancées et un son synchronisé de manière native.

Aperçu de Nano Banana Pro

Moteur de conception professionnel avec un noyau de raisonnement pour des visuels 4K de qualité studio, des mises en page complexes et un rendu de texte précis.

Aperçu de Veo 3.1 Lite

Génération, retouche et contrôle cinématique de vidéos très efficaces, à faible coût et axés sur les développeurs, de la famille Veo 3.1.

Nano Banana

Génération et retouche d'images natives de pointe, conçues pour des workflows créatifs rapides.

Imagen 4

Modèle texte en image, avec une génération rapide et ultra-rapide, et une clarté exceptionnelle jusqu'à une résolution de 2K.


Modèles de génération de musique

Cette section contient tous les modèles de génération de musique, y compris ceux qui peuvent déjà être répertoriés dans d'autres sections.

Aperçu de Lyria 3 Pro

Notre modèle de génération de musique phare, optimisé pour les chansons complètes avec une cohérence structurelle complexe.

Aperçu de Lyria 3 Clip

Optimisé pour générer des clips musicaux courts, des boucles et des aperçus jusqu'à 30 secondes.

Lyria RealTime (expérimental)

Modèle de génération de musique haute fidélité offrant un contrôle créatif précis et des capacités de streaming en temps réel.


Modèles d'outils et d'agents

Aperçu de l'utilisation de l'ordinateur

Modèle spécialisé capable de "voir" un écran numérique et d'effectuer des actions d'interface utilisateur telles que cliquer, taper et naviguer pour automatiser des tâches de navigateur complexes.

Aperçu de Gemini Deep Research

Modèle agentique qui planifie et exécute de manière autonome des recherches en plusieurs étapes sur des centaines de sources pour produire des rapports interactifs cités.

Aperçu de Gemini Deep Research Max

Exhaustivité maximale pour la collecte et la synthèse automatisées de contexte sur des centaines de sources.


Modèles de tâches spécialisées

Gemini Embedding 2

Notre premier modèle d'embedding multimodal, qui mappe le texte, les images, les vidéos, l'audio et les PDF dans un espace d'embedding unifié pour les systèmes de recherche sémantique et RAG avancés.

Gemini Embedding

Représentations vectorielles de grande dimension pour les systèmes de recherche sémantique, de classification de texte et RAG avancés.

Aperçu de Gemini Robotics-ER 1.6

Modèle de raisonnement incarné avancé qui comprend les espaces physiques et planifie des tâches en plusieurs étapes pour les agents robotiques avec de nouvelles fonctionnalités telles que la lecture d'instruments, le raisonnement spatial et physique amélioré.

Aperçu de Gemini Robotics-ER 1.5

Modèle de raisonnement incarné avancé qui comprend les espaces physiques et planifie des tâches en plusieurs étapes pour les agents robotiques.


Modèles précédents

Gemini 2.0 Flash (obsolète)

Notre modèle de travail de deuxième génération, avec des fonctionnalités de nouvelle génération et des capacités améliorées, y compris une vitesse supérieure, l'utilisation d'outils natifs et une fenêtre de contexte d'un million de jetons.

Gemini 2.0 Flash-Lite (obsolète)

Notre modèle de deuxième génération le plus rapide, optimisé pour l'efficacité des coûts et la faible latence.

Aperçu de Gemini 3 Pro Éteindre

Notre modèle de raisonnement de pointe, avec une compréhension multimodale avancée.


Modèles de noms de versions de modèles

Les modèles Gemini sont disponibles dans les versions stable, preview, latest ou experimental.

Stable

Pointe vers un modèle stable spécifique. Les modèles stables ne changent généralement pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

Exemple : gemini-2.5-flash.

Aperçu

Pointe vers un modèle en preview qui peut être utilisé en production. La facturation est généralement activée pour les modèles en preview, qui peuvent être soumis à des limites de débit plus restrictives et qui seront obsolètes avec un préavis d'au moins deux semaines.

Exemple : gemini-2.5-flash-preview-09-2025.

Les plus récents

Pointe vers la dernière version d'une variante de modèle spécifique. Il peut s'agir d'une version stable, en preview ou expérimentale. Cet alias sera remplacé à chaud à chaque nouvelle version d'une variante de modèle spécifique. Un préavis de deux semaines sera envoyé par e-mail avant le changement de version.

Exemple : gemini-flash-latest.

Expérimental

Pointe vers un modèle expérimental qui ne convient généralement pas à une utilisation en production et qui est soumis à des limites de débit plus restrictives. Nous publions des modèles expérimentaux pour recueillir des commentaires et mettre rapidement nos dernières mises à jour à la disposition des développeurs.

Les modèles expérimentaux ne sont pas stables et la disponibilité des points de terminaison des modèles est susceptible de changer.

Abandons de modèles

Pour en savoir plus sur les abandons de modèles, consultez la page Abandons de Gemini.