DeepSeek V3.2 : le modèle chinois qui casse les prix

À quoi ça me sert

Pipelines à gros volume : générer 10 000 résumés, classifier 100 000 commentaires — DeepSeek divise ma facture par 30 par rapport à GPT.
Brouillons en cascade : laisser DeepSeek faire 5 versions, choisir la meilleure, puis demander à Claude de polir. Stratégie "low cost + finition".
Apps grand public : startup qui veut intégrer une IA sans plomber sa marge, DeepSeek est imbattable sur le ratio qualité/prix.
Tester un cas d'usage : valider une idée sans claquer 50 € en tokens premium.
Tâches répétitives : avec le cache hit à 0,003 $, des prompts répétés deviennent quasi gratuits.

Comment ça se compare

vs GPT-5.5 / Claude Sonnet 4.6 : DeepSeek est 20-30× moins cher, performances ~5-10% en dessous sur les benchmarks durs, équivalent sur les tâches courantes. Choisir DeepSeek quand le prix prime, GPT/Claude quand la qualité absolue prime.

vs Llama 4 Maverick : prix proches, DeepSeek est généralement un cran au-dessus en benchmarks et propose un cache hit imbattable. Llama a un écosystème plus mature.

vs Qwen 3 : autre modèle chinois open-weight, prix proches. Qwen est meilleur en multilingue, DeepSeek en code et maths.

Combien ça coûte

Prix API au 25 mai 2026 (source : platform.deepseek.com/pricing) :

Input : 0,14 $ / million de tokens
Output : 0,28 $ / million de tokens
Cache hit : 0,0028 $ / million de tokens (oui, trois millièmes)
Poids du modèle : gratuit sur Hugging Face

Pour donner un ordre de grandeur : faire tourner 100 000 mails classés via DeepSeek = ~5 $. Le même volume via GPT-5.5 = ~150 $.

Mon avis

Je l'utilise pour mes pipelines volume et mes brouillons en cascade. Pas mon modèle de conversation, mais mon premier réflexe quand je dois traiter beaucoup à pas cher.

Ce que j'aime : le prix, vraiment. Et la qualité reste très convenable. Le cache hit change la façon dont je conçois mes prompts (je structure pour maximiser le cache).

Ce qui m'agace : le français est moins fluide que sur Sonnet, et la modération est plus stricte sur certains sujets sensibles (politique chinoise, Tibet, etc.). Pour des cas pro français, je vérifie toujours les sorties.

Questions rapides

DeepSeek envoie-t-il mes données en Chine ?

Sur leur API officielle, oui. Pour éviter ça : héberger Llama 4 ou DeepSeek soi-même, ou passer par Fireworks/Together (hébergeurs occidentaux).

DeepSeek est-il vraiment open-source ?

Open-weight (poids gratuits) sous licence MIT, ce qui est plus libre que Llama.

Y a-t-il une app grand public ?

Oui, chat.deepseek.com, gratuit avec inscription.

Vérifié le 2026-05-25 · prochaine relecture 2026-11-25

Prix et specs vérifiés sur la page pricing DeepSeek officielle. Usage personnel : pipelines automatisés 2-3 fois par semaine via Fireworks AI.

DeepSeek V3.2

DeepSeek V3.2, en clair