← Retour au glossaire A-Z
Modèle · Google · 2026

Gemini 2.5 Flash

Gemini 2.5 Flash, c'est le petit frère rapide et économique de Gemini 3.1 Pro. Idéal pour traiter du volume sans exploser le budget. Je l'utilise pour classifier des emails, extraire des données, faire tourner des scripts à la chaîne.

Modèle Lecture 4 min Mis à jour le 2026-05-25
— Ce que c'est

Gemini 2.5 Flash, en clair

Google a deux gammes : Pro (haut de gamme, intelligent, plus cher) et Flash (rapide, économique, suffisant pour 80% des tâches). Gemini 2.5 Flash, c'est la version Flash mise à jour début 2026 — toujours dispo en mai 2026 en attendant la 3.1 Flash.

Il garde le contexte d'1 million de tokens, le multimodal natif (texte, image, audio, vidéo), mais perd un peu en raisonnement pur. En échange, il répond presque instantanément et coûte 10× moins cher que Gemini 3.1 Pro.

C'est le modèle que tu touches sans le savoir quand tu utilises Google Workspace (Gmail "Help me write", Docs avec Gemini intégré).

À quoi ça me sert

  • Classifier en masse : 1000 emails à étiqueter par catégorie, Flash le fait en 5 minutes pour ~0,20 $.
  • Extraire des données : 200 factures PDF → tableur Excel avec date, montant, fournisseur. Flash parse tout, je vérifie 10% au hasard.
  • Résumer des transcriptions : podcast d'1h, résumé en 5 points, le tout pour ~0,03 $.
  • Modérer du contenu : filtrer les spams, détecter les avis injurieux, classifier des messages support.
  • Première passe avant Pro : laisser Flash brouillonner, puis demander à Pro de finir si c'est important.

Comment ça se compare

vs Gemini 3.1 Pro : Pro est plus précis et plus intelligent, 10× plus cher. Flash quand le volume prime, Pro quand la qualité prime.

vs Claude Haiku 4.5 : Haiku écrit mieux en français nuancé, Flash gère mieux les gros volumes (contexte 1M vs 200k) et coûte ~2× moins cher. Match nul sur la vitesse.

vs GPT-5 nano : prix proches, Flash a un contexte plus grand. GPT nano a de meilleurs benchmarks en raisonnement court.

Combien ça coûte

Prix API au 25 mai 2026 (source : ai.google.dev/pricing) :

  • Input : 0,30 $ / million de tokens
  • Output : 2,50 $ / million de tokens
  • Tier gratuit généreux pour tester (jusqu'à 1500 requêtes/jour)

Pour donner un ordre d'idée : 1000 emails de 500 mots à classifier = environ 0,15 $. Difficile à battre.

Mon avis

Mon modèle de référence pour les tâches en volume. Quand j'ai 500 trucs à traiter à la chaîne, je sors Flash. Quand j'ai une conversation où je veux du fond, je passe à Sonnet ou GPT-5.5.

Ce que j'aime : le tier gratuit qui permet de tester sans sortir la carte bleue, la vitesse, le contexte qui ne te bride jamais.

Ce qui m'agace : il invente parfois des trucs sur les questions pointues. Toujours vérifier les sorties critiques.

Questions rapides

Flash ou Pro pour démarrer ?

Flash pour tester sans frais. Pro quand tu valides un cas d'usage qui mérite la qualité.

Combien de tokens dans son contexte ?

1 million de tokens, comme Pro.

Y a-t-il un tier gratuit ?

Oui, généreux : ~1500 requêtes/jour sur Google AI Studio.

Vérifié le 2026-05-25 · prochaine relecture 2026-11-25

Prix et specs vérifiés sur Google AI pricing. Usage personnel : tâches en volume via API, 2-3 fois par semaine.

Tu veux continuer dans l'ordre ?

Reviens au glossaire complet, cherche un mot, puis ouvre seulement les pages qui méritent plus qu'une définition courte.

Ouvrir le glossaire IA