GPT ou Claude Sonnet
Si tu veux avancer sans comparer pendant une heure, commence ici. Ce sont les deux choix les plus simples pour réfléchir, écrire et décider.
Voir les frontier →GPT, Claude, Gemini, Mistral, Llama, DeepSeek, Nano Banana, Sora, ElevenLabs... Tout le monde promet d'être le meilleur. Ici, je trie par usage réel : écrire, coder, chercher, générer une image, produire une vidéo, garder tes données ou payer moins cher.
Le plus puissant n'est pas toujours le meilleur choix. Le bon modèle, c'est celui qui colle à ta tâche, ton budget et ton niveau de risque.
Si tu veux avancer sans comparer pendant une heure, commence ici. Ce sont les deux choix les plus simples pour réfléchir, écrire et décider.
Voir les frontier →Pour modifier un projet, corriger un bug ou lancer des tests, prends un modèle pensé pour travailler avec des fichiers et un terminal.
Voir les modèles code →Quand tu traites beaucoup de textes courts, le meilleur modèle n'est pas toujours le plus cher. Le bon choix est souvent le plus régulier.
Voir les low cost →Le local sert surtout quand tes données ne doivent pas partir chez un fournisseur. Ce n'est pas automatiquement plus simple ni moins cher.
Voir l'open-weight →Pour les visuels, je sépare les modèles de brouillon rapide et les modèles de rendu final.
Ouvrir la page image →La vidéo IA n'est pas un simple LLM avec une caméra. Les critères changent : durée, cohérence, audio, montage.
Voir les modèles vidéo →La bonne question n'est pas "quel modèle est le plus fort ?". C'est "qu'est-ce que je veux lui faire faire, avec quelles données, et combien d'erreurs je peux tolérer ?".
Commence par GPT ou Claude Sonnet. Ils savent écrire, résumer, comparer, reformuler et t'aider à décider sans réglages compliqués.
Évite de commencer par un modèle local : tu vas gérer la technique avant d'avoir validé l'usage.
Claude Sonnet est le choix le plus naturel pour un texte propre, nuancé, bien structuré. GPT reste excellent si tu veux plus d'outils autour.
Pour publier, demande toujours une version plus courte et une version plus directe.
Perplexity Sonar sert à répondre avec liens et sources. C'est plus proche d'un moteur de réponse que d'un assistant créatif.
Garde un réflexe simple : une source citée n'est pas forcément une source suffisante.
Gemini est très fort quand tu donnes beaucoup de PDF, images, tableaux ou transcriptions d'un coup.
Pour un dossier sensible avec citations, Claude reste très bon si les PDF contiennent du texte lisible.
GPT-Codex ou Claude Code sont les bons choix si l'IA doit lire un projet, modifier des fichiers et lancer des tests.
Ne lui demande pas "fais tout". Demande un plan, une petite étape, puis une vérification.
Haiku, Gemini Flash, Qwen ou DeepSeek sont souvent plus rationnels que les modèles premium pour classer, résumer ou extraire en volume.
Le modèle premium sert au contrôle final, pas forcément à chaque ligne traitée.
Qwen, Mistral, Phi ou Gemma peuvent tourner localement ou sur ton propre serveur selon la taille choisie.
Local veut dire plus de contrôle, mais aussi machine, maintenance, logs et mises à jour.
Ne descends pas seulement en prix. Descends en difficulté : petits modèles pour tâches simples, gros modèles pour décisions importantes.
Le mauvais calcul, c'est un modèle moins cher qui t'oblige à tout relire deux fois.
ElevenLabs v3 ou GPT-Realtime selon que tu veux une voix studio ou une conversation temps réel. Pour de la transcription, prends Whisper ou Scribe.
Si tu veux du local sans envoyer ta voix à un fournisseur : Moshi (Kyutai, CC-BY) est le seul choix sérieux à ce jour.
Claude Haiku 4.5 ou Gemini 2.5 Flash-Lite sont le bon point de départ. Petit, rapide, peu cher, suffisant pour répondre aux 80 % des questions clients.
Garde un modèle premium en backup pour les cas complexes que le petit n'arrive pas à gérer.
| Mot | Traduction simple | Ce que ça change pour ton choix |
|---|---|---|
| Contexte | Tout ce que le modèle peut garder sous les yeux pendant qu'il répond. | Utile pour gros dossiers. Inutile de payer très long si tu poses des questions courtes. |
| Open-weight | Les poids du modèle sont disponibles, mais la licence peut rester encadrée. | Bon pour contrôle et local. À relire avant un produit commercial. |
| RAG | Le système cherche d'abord les bons passages dans tes documents, puis les donne au modèle. | Meilleur qu'un énorme prompt si tu as une base documentaire qui vit dans le temps. |
| Reranking | Un deuxième tri plus précis après une recherche large. | Très utile pour éviter que l'assistant réponde avec le mauvais document. |
Mon top 6 du moment. Ceux que j'utilise vraiment chaque semaine — pour mes mails, mes photos, mon podcast, mes outils internes.
Mon assistant par défaut pour réfléchir, écrire, organiser. Le meilleur équilibre prix/qualité quand je veux quelque chose de propre du premier coup.
Quand la tâche est complexe ou que je sens que je vais y passer du temps. Plus cher, mais souvent ça vaut le prix.
Ce que j'utilise pour les photos Airbnb de ma mère et le générateur de photos personal branding. Le meilleur rapport qualité/prix sur l'édition photo.
Pour traiter des PDF longs, des bases de code entières ou des transcriptions. Un million de tokens de contexte à moins d'un dollar.
Ce que j'utilise pour les voix du podcast Jerwis Productions. Multilingue, multi-personnages, qualité studio.
Le sauveur de mes scripts à fort volume. Apache 2.0 donc je peux le faire tourner sur mes machines si besoin. Imbattable sur le prix.
52 modèles classés par budget et par usage. Si tu hésites, regarde plutôt Mes raccourcis plus haut — c'est mon top 6.
Quand le résultat doit être au top : raisonnement, code complexe, agents, longs contextes. Compte 15-30 $ par million de tokens. Tu les utilises quand le coût d'une erreur dépasse le coût du modèle.
Pour traiter beaucoup de tâches simples : classer, résumer, extraire, taguer. Souvent 10× moins cher que les frontier. À combiner avec un modèle premium pour le contrôle final.
Pour garder le contrôle de tes données ou expérimenter sans abonnement. La taille du modèle fait le besoin matériel : 3B tourne sur un Mac, 70B demande un GPU sérieux.
Optimisé pour répondre avec liens et citations à jour. Plus moteur de réponse qu'assistant créatif. Réflexe à garder : une source citée n'est pas forcément une source suffisante.
Image, vidéo et audio ont une page dédiée avec guide de décision, table comparative, workflow type et toutes les voix que j'utilise pour le podcast Guerres d'IA.
Nano Banana, GPT Image, Midjourney, Ideogram, FLUX, Stable Diffusion.
Sora, Veo 3.1, Gemini Omni, Runway Gen-4, Kling, Grok Imagine.
Eleven v3, Gemini Native Audio, Whisper, Voxtral. Ma stack podcast.
Tu ne les utilises pas seul, tu les combines pour faire un RAG : on cherche d'abord dans tes documents (embeddings), on tri (reranking), puis on passe au LLM. Plus précis que coller 100 pages dans un prompt.
Modèles fournis directement par l'OS ou la plate-forme. À connaître si tu construis sur cette base, sinon tu peux ignorer.
Je ne crois pas au meilleur modèle universel. Un modèle peut être excellent et rester un mauvais choix si le prix, la latence ou les données ne collent pas.
Je sépare open source, open-weight, licence custom et propriétaire. C'est moins sexy, mais c'est ce qui évite les mauvaises surprises.
Les fiches ont une date de vérification. Si une source change, je corrige. Si un modèle devient legacy, il partira dans les archives.
Je teste ces modèles pour mes propres projets. Quand un outil mérite vraiment ton attention, je le mets dans la newsletter.