← Retour au glossaire A-Z
Modèle · DeepSeek · 2026

DeepSeek V3.2

DeepSeek V3.2, c'est le modèle open-weight chinois sorti début 2026. Performances très proches de GPT-5 sur la majorité des benchmarks, à 30× moins cher sur l'API. Quand le budget compte, c'est le premier réflexe.

Modèle Lecture 5 min Mis à jour le 2026-05-25
— Ce que c'est

DeepSeek V3.2, en clair

DeepSeek est un labo chinois (filiale du fonds quantitatif High-Flyer Capital) qui a explosé fin 2024 avec DeepSeek R1, son premier modèle de raisonnement open-weight. V3.2 est la mise à jour de leur modèle généraliste, sortie début 2026.

Open-weight comme Llama : les poids sont publiés gratuitement, n'importe qui peut le faire tourner. Mais DeepSeek va plus loin que Meta sur les prix : sur leur API officielle, le cache hit (quand tu réinterroges du contenu déjà vu) tombe à 0,003 $ / million de tokens. C'est dingue.

Performances : très proches de GPT-5 et Claude Sonnet 4.6 sur les benchmarks publics, légèrement en dessous sur le raisonnement vraiment dur.

À quoi ça me sert

  • Pipelines à gros volume : générer 10 000 résumés, classifier 100 000 commentaires — DeepSeek divise ma facture par 30 par rapport à GPT.
  • Brouillons en cascade : laisser DeepSeek faire 5 versions, choisir la meilleure, puis demander à Claude de polir. Stratégie "low cost + finition".
  • Apps grand public : startup qui veut intégrer une IA sans plomber sa marge, DeepSeek est imbattable sur le ratio qualité/prix.
  • Tester un cas d'usage : valider une idée sans claquer 50 € en tokens premium.
  • Tâches répétitives : avec le cache hit à 0,003 $, des prompts répétés deviennent quasi gratuits.

Comment ça se compare

vs GPT-5.5 / Claude Sonnet 4.6 : DeepSeek est 20-30× moins cher, performances ~5-10% en dessous sur les benchmarks durs, équivalent sur les tâches courantes. Choisir DeepSeek quand le prix prime, GPT/Claude quand la qualité absolue prime.

vs Llama 4 Maverick : prix proches, DeepSeek est généralement un cran au-dessus en benchmarks et propose un cache hit imbattable. Llama a un écosystème plus mature.

vs Qwen 3 : autre modèle chinois open-weight, prix proches. Qwen est meilleur en multilingue, DeepSeek en code et maths.

Combien ça coûte

Prix API au 25 mai 2026 (source : platform.deepseek.com/pricing) :

  • Input : 0,14 $ / million de tokens
  • Output : 0,28 $ / million de tokens
  • Cache hit : 0,0028 $ / million de tokens (oui, trois millièmes)
  • Poids du modèle : gratuit sur Hugging Face

Pour donner un ordre de grandeur : faire tourner 100 000 mails classés via DeepSeek = ~5 $. Le même volume via GPT-5.5 = ~150 $.

Mon avis

Je l'utilise pour mes pipelines volume et mes brouillons en cascade. Pas mon modèle de conversation, mais mon premier réflexe quand je dois traiter beaucoup à pas cher.

Ce que j'aime : le prix, vraiment. Et la qualité reste très convenable. Le cache hit change la façon dont je conçois mes prompts (je structure pour maximiser le cache).

Ce qui m'agace : le français est moins fluide que sur Sonnet, et la modération est plus stricte sur certains sujets sensibles (politique chinoise, Tibet, etc.). Pour des cas pro français, je vérifie toujours les sorties.

Questions rapides

DeepSeek envoie-t-il mes données en Chine ?

Sur leur API officielle, oui. Pour éviter ça : héberger Llama 4 ou DeepSeek soi-même, ou passer par Fireworks/Together (hébergeurs occidentaux).

DeepSeek est-il vraiment open-source ?

Open-weight (poids gratuits) sous licence MIT, ce qui est plus libre que Llama.

Y a-t-il une app grand public ?

Oui, chat.deepseek.com, gratuit avec inscription.

Vérifié le 2026-05-25 · prochaine relecture 2026-11-25

Prix et specs vérifiés sur la page pricing DeepSeek officielle. Usage personnel : pipelines automatisés 2-3 fois par semaine via Fireworks AI.

Tu veux continuer dans l'ordre ?

Reviens au glossaire complet, cherche un mot, puis ouvre seulement les pages qui méritent plus qu'une définition courte.

Ouvrir le glossaire IA