Gemini 2.5 Flash : le modèle Google rapide et bon marché

À quoi ça me sert

Classifier en masse : 1000 emails à étiqueter par catégorie, Flash le fait en 5 minutes pour ~0,20 $.
Extraire des données : 200 factures PDF → tableur Excel avec date, montant, fournisseur. Flash parse tout, je vérifie 10% au hasard.
Résumer des transcriptions : podcast d'1h, résumé en 5 points, le tout pour ~0,03 $.
Modérer du contenu : filtrer les spams, détecter les avis injurieux, classifier des messages support.
Première passe avant Pro : laisser Flash brouillonner, puis demander à Pro de finir si c'est important.

Comment ça se compare

vs Gemini 3.1 Pro : Pro est plus précis et plus intelligent, 10× plus cher. Flash quand le volume prime, Pro quand la qualité prime.

vs Claude Haiku 4.5 : Haiku écrit mieux en français nuancé, Flash gère mieux les gros volumes (contexte 1M vs 200k) et coûte ~2× moins cher. Match nul sur la vitesse.

vs GPT-5 nano : prix proches, Flash a un contexte plus grand. GPT nano a de meilleurs benchmarks en raisonnement court.

Combien ça coûte

Prix API au 25 mai 2026 (source : ai.google.dev/pricing) :

Input : 0,30 $ / million de tokens
Output : 2,50 $ / million de tokens
Tier gratuit généreux pour tester (jusqu'à 1500 requêtes/jour)

Pour donner un ordre d'idée : 1000 emails de 500 mots à classifier = environ 0,15 $. Difficile à battre.

Mon avis

Mon modèle de référence pour les tâches en volume. Quand j'ai 500 trucs à traiter à la chaîne, je sors Flash. Quand j'ai une conversation où je veux du fond, je passe à Sonnet ou GPT-5.5.

Ce que j'aime : le tier gratuit qui permet de tester sans sortir la carte bleue, la vitesse, le contexte qui ne te bride jamais.

Ce qui m'agace : il invente parfois des trucs sur les questions pointues. Toujours vérifier les sorties critiques.

Questions rapides

Flash ou Pro pour démarrer ?

Gemini 2.5 Flash est le modèle léger de Google : rapide, multimodal, contexte d'1 million de tokens, environ 10 fois moins cher que Gemini 3.1 Pro. Idéal pour les tâches en volume comme la classification ou l'extraction de données.

Combien de tokens dans son contexte ?

1 million de tokens, comme Pro.

Y a-t-il un tier gratuit ?

Oui, généreux : ~1500 requêtes/jour sur Google AI Studio.

Vérifié le 2026-05-25 · prochaine relecture 2026-11-25

Prix et specs vérifiés sur Google AI pricing. Usage personnel : tâches en volume via API, 2-3 fois par semaine.

Gemini 2.5 Flash

Gemini 2.5 Flash, en clair