Catalogue vivant · mis à jour le 20 mai 2026

Modèles IA :
lequel choisir ?

GPT, Claude, Gemini, Mistral, Llama, DeepSeek, Nano Banana, Sora, ElevenLabs... Tout le monde promet d'être le meilleur. Ici, je trie par usage réel : écrire, coder, chercher, générer une image, produire une vidéo, garder tes données ou payer moins cher.

Étape 01

Pars de ton besoin.

Le plus puissant n'est pas toujours le meilleur choix. Le bon modèle, c'est celui qui colle à ta tâche, ton budget et ton niveau de risque.

Assistant généraliste

GPT ou Claude Sonnet

Si tu veux avancer sans comparer pendant une heure, commence ici. Ce sont les deux choix les plus simples pour réfléchir, écrire et décider.

Voir les frontier →
Code et agents

GPT-Codex, Claude, Qwen Coder

Pour modifier un projet, corriger un bug ou lancer des tests, prends un modèle pensé pour travailler avec des fichiers et un terminal.

Voir les modèles code →
Budget serré

Gemini Flash, DeepSeek, Qwen

Quand tu traites beaucoup de textes courts, le meilleur modèle n'est pas toujours le plus cher. Le bon choix est souvent le plus régulier.

Voir les low cost →
Local / confidentialité

Qwen, Mistral, Phi, Gemma

Le local sert surtout quand tes données ne doivent pas partir chez un fournisseur. Ce n'est pas automatiquement plus simple ni moins cher.

Voir l'open-weight →
Image

Nano Banana, Ideogram, FLUX

Pour les visuels, je sépare les modèles de brouillon rapide et les modèles de rendu final.

Ouvrir la page image →
Vidéo

Gemini Omni, Sora, Veo

La vidéo IA n'est pas un simple LLM avec une caméra. Les critères changent : durée, cohérence, audio, montage.

Voir les modèles vidéo →
Guide simple

Dans ta situation...

La bonne question n'est pas "quel modèle est le plus fort ?". C'est "qu'est-ce que je veux lui faire faire, avec quelles données, et combien d'erreurs je peux tolérer ?".

Je veux un assistant quotidien

Commence par GPT ou Claude Sonnet. Ils savent écrire, résumer, comparer, reformuler et t'aider à décider sans réglages compliqués.

Évite de commencer par un modèle local : tu vas gérer la technique avant d'avoir validé l'usage.

Je veux écrire mieux

Claude Sonnet est le choix le plus naturel pour un texte propre, nuancé, bien structuré. GPT reste excellent si tu veux plus d'outils autour.

Pour publier, demande toujours une version plus courte et une version plus directe.

Je veux chercher avec sources

Perplexity Sonar sert à répondre avec liens et sources. C'est plus proche d'un moteur de réponse que d'un assistant créatif.

Garde un réflexe simple : une source citée n'est pas forcément une source suffisante.

Je veux lire un gros dossier

Gemini est très fort quand tu donnes beaucoup de PDF, images, tableaux ou transcriptions d'un coup.

Pour un dossier sensible avec citations, Claude reste très bon si les PDF contiennent du texte lisible.

Je veux coder avec l'IA

GPT-Codex ou Claude Code sont les bons choix si l'IA doit lire un projet, modifier des fichiers et lancer des tests.

Ne lui demande pas "fais tout". Demande un plan, une petite étape, puis une vérification.

Je veux automatiser beaucoup

Haiku, Gemini Flash, Qwen ou DeepSeek sont souvent plus rationnels que les modèles premium pour classer, résumer ou extraire en volume.

Le modèle premium sert au contrôle final, pas forcément à chaque ligne traitée.

Je veux garder mes données

Qwen, Mistral, Phi ou Gemma peuvent tourner localement ou sur ton propre serveur selon la taille choisie.

Local veut dire plus de contrôle, mais aussi machine, maintenance, logs et mises à jour.

Je veux payer moins cher

Ne descends pas seulement en prix. Descends en difficulté : petits modèles pour tâches simples, gros modèles pour décisions importantes.

Le mauvais calcul, c'est un modèle moins cher qui t'oblige à tout relire deux fois.

Je veux un assistant vocal

ElevenLabs v3 ou GPT-Realtime selon que tu veux une voix studio ou une conversation temps réel. Pour de la transcription, prends Whisper ou Scribe.

Si tu veux du local sans envoyer ta voix à un fournisseur : Moshi (Kyutai, CC-BY) est le seul choix sérieux à ce jour.

Je veux un chatbot sur mon site

Claude Haiku 4.5 ou Gemini 2.5 Flash-Lite sont le bon point de départ. Petit, rapide, peu cher, suffisant pour répondre aux 80 % des questions clients.

Garde un modèle premium en backup pour les cas complexes que le petit n'arrive pas à gérer.

Mot Traduction simple Ce que ça change pour ton choix
Contexte Tout ce que le modèle peut garder sous les yeux pendant qu'il répond. Utile pour gros dossiers. Inutile de payer très long si tu poses des questions courtes.
Open-weight Les poids du modèle sont disponibles, mais la licence peut rester encadrée. Bon pour contrôle et local. À relire avant un produit commercial.
RAG Le système cherche d'abord les bons passages dans tes documents, puis les donne au modèle. Meilleur qu'un énorme prompt si tu as une base documentaire qui vit dans le temps.
Reranking Un deuxième tri plus précis après une recherche large. Très utile pour éviter que l'assistant réponde avec le mauvais document.
Étape 02

Mes raccourcis.

Mon top 6 du moment. Ceux que j'utilise vraiment chaque semaine — pour mes mails, mes photos, mon podcast, mes outils internes.

Assistant général

Claude Sonnet 4.6

Mon assistant par défaut pour réfléchir, écrire, organiser. Le meilleur équilibre prix/qualité quand je veux quelque chose de propre du premier coup.

llm standard fermé
Quand je veux le top

GPT-5.4

Quand la tâche est complexe ou que je sens que je vais y passer du temps. Plus cher, mais souvent ça vaut le prix.

llm premium fermé
Photos & images

Nano Banana

Ce que j'utilise pour les photos Airbnb de ma mère et le générateur de photos personal branding. Le meilleur rapport qualité/prix sur l'édition photo.

image low cost fermé
Gros documents

Gemini 2.5 Flash

Pour traiter des PDF longs, des bases de code entières ou des transcriptions. Un million de tokens de contexte à moins d'un dollar.

llm low cost fermé
Voix & podcast

ElevenLabs v3

Ce que j'utilise pour les voix du podcast Jerwis Productions. Multilingue, multi-personnages, qualité studio.

audio standard fermé
Budget serré · ouvert

Mistral Small 4

Le sauveur de mes scripts à fort volume. Apache 2.0 donc je peux le faire tourner sur mes machines si besoin. Imbattable sur le prix.

llm low cost open
Étape 03

Le catalogue, par groupes.

52 modèles classés par budget et par usage. Si tu hésites, regarde plutôt Mes raccourcis plus haut — c'est mon top 6.

Comparateur
Aucun modèle ne matche ta recherche. Essaie un autre mot-clé ou regarde "Mes raccourcis" plus haut pour les choix par défaut.
Frontier · Premium

Les LLM les plus capables

Quand le résultat doit être au top : raisonnement, code complexe, agents, longs contextes. Compte 15-30 $ par million de tokens. Tu les utilises quand le coût d'une erreur dépasse le coût du modèle.

Low cost · Volume

Bon rapport qualité/prix

Pour traiter beaucoup de tâches simples : classer, résumer, extraire, taguer. Souvent 10× moins cher que les frontier. À combiner avec un modèle premium pour le contrôle final.

Open-weight · Local

Les modèles que tu peux héberger

Pour garder le contrôle de tes données ou expérimenter sans abonnement. La taille du modèle fait le besoin matériel : 3B tourne sur un Mac, 70B demande un GPU sérieux.

Image · Vidéo · Audio

Les modèles créatifs

Image, vidéo et audio ont une page dédiée avec guide de décision, table comparative, workflow type et toutes les voix que j'utilise pour le podcast Guerres d'IA.

RAG · Embeddings · Rerank

Les briques pour ta base documentaire

Tu ne les utilises pas seul, tu les combines pour faire un RAG : on cherche d'abord dans tes documents (embeddings), on tri (reranking), puis on passe au LLM. Plus précis que coller 100 pages dans un prompt.

Plate-forme spécifique

Modèles intégrés natifs

Modèles fournis directement par l'OS ou la plate-forme. À connaître si tu construis sur cette base, sinon tu peux ignorer.

Pas un classement magique

Je ne crois pas au meilleur modèle universel. Un modèle peut être excellent et rester un mauvais choix si le prix, la latence ou les données ne collent pas.

Open ne veut pas toujours dire libre

Je sépare open source, open-weight, licence custom et propriétaire. C'est moins sexy, mais c'est ce qui évite les mauvaises surprises.

Vérification mensuelle

Les fiches ont une date de vérification. Si une source change, je corrige. Si un modèle devient legacy, il partira dans les archives.

Atlas mondial · 156 modèles

Tu veux la carte du monde IA ?

J'ai mis à part le catalogue complet par pays : USA, Europe, Chine. 156 modèles, ce qu'ils font et combien ils coûtent. Pas indispensable pour choisir — mais pratique si tu veux comprendre qui fait quoi dans le paysage.

Tu veux la veille ?

Je teste ces modèles pour mes propres projets. Quand un outil mérite vraiment ton attention, je le mets dans la newsletter.

Rejoindre la newsletter