Choisir son modèle en 2026 · décide en 5 minutes
Tu as la liste des modèles dans le catalogue. Bien. Maintenant la vraie question : lequel pour toi ? Je t'ai posé l'arbre de décision que je suis moi-même quand quelqu'un me demande conseil. 6 étapes. Pas de techno-fétichisme. Juste ton usage, ton budget, tes données. À la fin tu sors avec un nom de modèle et tu t'y mets.
Tu réponds à 4 questions, je te donne le bon modèle
Étapes 1 à 4 : tu choisis dans chaque carte la réponse qui te ressemble. Étape 5 : tu regardes les tableaux selon ton cas d'usage réel. Étape 6 : tu vois ce que j'utilise moi en 2026 et pourquoi. Si tu hésites entre deux options à une étape, prends la moins chère. Tu pourras toujours passer à la plus chère plus tard.
Tu peux aussi aller voir le catalogue complet des modèles 2026 pour les specs détaillées. Ici on décide. Là-bas on compare.
Pourquoi tu veux un modèle ?
L'erreur la plus fréquente, c'est de prendre "le meilleur modèle de 2026" pour faire une tâche où le meilleur modèle est en fait spécialisé ailleurs. Choisis d'abord ton usage principal — pas les 12 cas hypothétiques.
Assistant général au quotidien
Écrire des emails, résumer des PDF, brainstormer, faire des tableaux, traduire. 80 % des usages réels.
→ Claude Sonnet 4.6, ChatGPT 5, Gemini 2.5 Pro font tous très bien le job.
Coder ou faire coder pour toi
Construire un site, automatiser un workflow, écrire des scripts. Même si tu n'es pas dev, l'IA peut coder pour toi.
→ Claude Sonnet 4.6 + Claude Code est le combo qui domine 2026 chez les non-dev.
Lire de très gros documents
Avaler un rapport de 200 pages, analyser un contrat, comparer 10 PDF en même temps.
→ Gemini 2.5 Pro (contexte 1M tokens) ou Claude Sonnet 4.6 (1M).
Créer des images
Visuels marketing, illustrations, photos produits, retouches.
→ Nano Banana (Gemini Image), Midjourney v7, Flux 2 Pro.
Créer des vidéos
Courtes vidéos publicitaires, démos produit animées, contenus pour réseaux sociaux.
→ Veo 3 (Google), Sora 2 (OpenAI), Runway Gen-4.
Créer de l'audio · cloner ta voix
Voix-off, podcast, narration, agent vocal qui parle.
→ ElevenLabs v3 reste la référence. Hume EVI 3 pour la conversation temps réel.
Agent autonome qui bosse seul
Tu lui donnes une mission, il enchaîne les étapes pendant 30 min sans que tu valides chaque clic.
→ Claude Sonnet 4.6 (tool use natif) ou GPT-5 avec Responses API.
Combien tu veux dépenser ?
Sois honnête. Si tu débutes, le gratuit suffit largement. Si tu vis dedans 4h par jour, l'abonnement à 20-30 € rentabilise la première semaine. Le pro à 200 €, c'est pour ceux qui ont vraiment besoin du frontier au quotidien.
Tu veux du gratuit
Pour démarrer ou pour des usages occasionnels.
→ ChatGPT free (GPT-5 limité), Claude free (Sonnet limité), Le Chat de Mistral (gratuit illimité, made in France), Gemini free (2.5 Flash).
Tu veux la version pro normale
Le sweet spot pour 95 % des entrepreneurs. Limites confortables, accès aux meilleurs modèles.
→ Claude Pro (22 €), ChatGPT Plus (23 €), Gemini Advanced (22 €). Un seul abonnement suffit en général.
Tu veux le frontier sans plafond
Tu utilises l'IA 4h+ par jour. Limites énormes, Claude Code Max, ChatGPT Pro avec o1.
→ Claude Max (110 € ou 220 €), ChatGPT Pro (220 €). Sortir si tu n'atteins pas les plafonds régulièrement.
Tu paies à l'usage (pour bâtir)
Tu construis un outil pour ton business, pas pour discuter au quotidien. Tu paies au token consommé.
→ API Anthropic / OpenAI / Google direct, ou OpenRouter pour switcher de modèle sans changer de code.
Tes données doivent rester chez toi ?
Question qui ne se posait pas avant. Aujourd'hui si tu manipules du secret pro, des données clients sensibles, des dossiers médicaux ou juridiques, tu dois te la poser. La bonne nouvelle : les modèles open-weight de 2026 sont assez bons pour faire 90 % du travail localement.
Non, le cloud est OK
Tu fais du marketing, du brainstorm, du résumé d'articles publics. Les conditions d'Anthropic/OpenAI/Google te conviennent.
→ Claude · ChatGPT · Gemini · Le Chat en cloud, plans payants pour le "no training on your data".
Oui, la data reste chez moi
Secret professionnel, RGPD strict, données médicales/juridiques, ou simple principe.
→ Mistral Small 4 (24B, tourne sur un bon MacBook), Llama 4, Qwen 3. Servis via Ollama ou LM Studio en local.
Tu veux du frontier ou du quotidien fiable ?
Le frontier model est ce qui sort de mieux ce trimestre. Bluffant en démo, parfois instable en prod. Le quotidien fiable, c'est le modèle qui a 6 mois, qui ne plante plus, qui coûte moins cher et qui fait 95 % du job du frontier.
Frontier · "je veux le top du moment"
Tu suis l'IA de près, tu acceptes des bugs et des prix élevés en échange du dernier cri.
→ Claude Opus 4.7, GPT-5 Pro, Gemini 2.5 Ultra. Prix au token x5 à x10 vs quotidien.
Quotidien fiable · "je veux que ça marche"
Tu veux un outil prévisible, pas une démo. 95 % du job du frontier, 20 % du prix.
→ Claude Sonnet 4.6, GPT-5 mini, Gemini 2.5 Pro. C'est ici que je passe ma vie.
Recommandations finales par cas d'usage
6 tableaux concrets. Tu trouves ton cas, tu prends le modèle indiqué, tu t'y mets. J'ai mis "1er choix" (ce que je prendrais aujourd'hui) et "alternative" (si tu n'aimes pas le premier ou si budget différent).
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | Claude Sonnet 4.6 | GPT-5 mini via API |
| Pourquoi | Excellent en tool use et écriture pro française. Fiable sur des prompts répétés. | Plus rapide en latence si tu fais 1000+ appels/jour. |
| Budget | API · ~3 $/M tokens entrée, 15 $/M sortie | API · ~0,25 $/M entrée, 2 $/M sortie |
| Risque | Coût qui monte si tu traites de gros volumes sans cache. | Moins bon en français nuancé. |
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | Claude Sonnet 4.6 | ChatGPT Plus (GPT-5) |
| Pourquoi | Voix la plus naturelle en français, sait ne pas écrire "il est important de noter". | Plus de variété stylistique, recherche web intégrée. |
| Budget | Claude Pro · 22 €/mois | ChatGPT Plus · 23 €/mois |
| Risque | Reste un peu plat sans bon prompt et exemples. | Tics rédactionnels GPT (em-dashes, listes). |
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | Claude Sonnet 4.6 + Claude Code | Cursor avec GPT-5 |
| Pourquoi | Le combo CLI le plus pédagogue. Comprend ton intention même si tu décris flou. | IDE plus complet si tu veux voir le code visuellement. |
| Budget | Claude Max · 110 €/mois (recommandé) | Cursor Pro · 20 €/mois + clé API GPT-5 |
| Risque | Tu peux atteindre la limite si tu codes 6h/jour. | Setup plus technique pour démarrer. |
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | Nano Banana (Gemini Image) | Midjourney v7 |
| Pourquoi | Cohérence du visage exceptionnelle entre 10 photos, prompt en français OK. | Esthétique plus léchée, plus de contrôle artistique. |
| Budget | Gemini Advanced · 22 €/mois inclus | Midjourney · 30 $/mois |
| Risque | Encore quelques mains bizarres sur les plans serrés. | Apprentissage de la syntaxe Midjourney plus long. |
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | ElevenLabs v3 | Hume EVI 3 (pour temps réel) |
| Pourquoi | Le clonage de voix le plus convaincant. Intonations émotionnelles maîtrisées. | Conversation vocale fluide pour agent vocal téléphonique. |
| Budget | Creator · 22 $/mois (10h audio) | API à l'usage · ~0,18 $/min |
| Risque | Coût qui monte vite si tu fais plus de 10h/mois. | Pas conçu pour produire du fichier audio, conçu pour discuter. |
| Critère | 1er choix | Alternative |
|---|---|---|
| Modèle | Perplexity Pro | ChatGPT Plus avec mode "Deep Research" |
| Pourquoi | Citations propres, vraies sources, pas d'hallucinations sur les chiffres récents. | Synthèses plus profondes mais demande plus de temps de génération. |
| Budget | Perplexity Pro · 20 €/mois | ChatGPT Plus · 23 €/mois |
| Risque | Manque de profondeur sur les sujets très techniques. | Mode Deep Research limité en quota. |
Mes choix perso en 2026
Pour clore : voici ce que j'utilise vraiment dans une semaine type. Pas la liste idéale, la liste réelle. Avec le pourquoi en clair. Si tu copies mon setup, tu n'as plus qu'à t'y mettre.
Claude Sonnet 4.6
Mon modèle quotidien. Plan Claude Max à 110 €/mois pour profiter de Claude Code sans limite. C'est lui qui rédige mes brouillons d'articles, qui code mes scripts, qui m'aide à structurer mes idées.
Pourquoi pas GPT-5 ? Le français de Claude est plus naturel, et Claude Code est la meilleure interface CLI du marché. Pour un non-dev, c'est game-changer.
Nano Banana (Gemini Image)
Pour générer mes photos LinkedIn et illustrations d'articles. La cohérence du visage entre plusieurs photos est le critère qui m'a fait basculer.
Inclus dans mon abonnement Gemini Advanced (22 €/mois) que je garde pour cette feature et pour le contexte 1M tokens quand je dois avaler un gros rapport.
ElevenLabs v3
Pour le podcast Jerwis Productions. Ma voix clonée pour les narrations, et des voix génériques pour les épisodes scénarisés à plusieurs personnages.
Plan Creator à 22 $/mois, suffisant pour 10h d'audio par mois. Si je passais à 4 épisodes/semaine, je monterais en Pro.
Mistral Small 4 via Ollama
Pour les traitements où je ne veux pas envoyer la data en cloud (brouillons de réponses commerciales, infos clients, idées en chantier). Tourne sur mon MacBook Pro M3 sans broncher.
Gratuit, made in France, et étonnamment bon pour 80 % des tâches courantes. Le compromis confidentialité/qualité parfait pour 2026.
Tu veux que je t'envoie ce genre de décryptage chaque vendredi ?
Je tiens une veille IA hebdo (« AI Playbook ») où je décode ce qui change vraiment côté modèles, outils et usages. Désinscription en 1 clic, jamais de pub, juste ce que je consomme moi.
M'inscrire à AI Playbook