Exemple concret
GPT-4 répond. On entraîne un petit modèle à reproduire ses réponses. Le petit devient presque aussi bon, pour 10× moins cher.
Pourquoi ça compte
La distillation explique pourquoi les modèles 'mini' (Haiku, Gemini Flash, GPT-4o mini) sont si bons malgré leur petite taille.
Tu la vois quand on cherche à réduire les coûts tout en gardant une qualité proche.
À ne pas confondre
Fine-tuning : Le fine-tuning adapte un modèle existant sur des exemples pour améliorer un comportement précis.
Quantization : La quantization réduit la précision interne d'un modèle pour gagner en mémoire et vitesse.
Erreurs fréquentes
- Confondre distillation et fine-tuning : ce n'est pas la même chose.
- Croire qu'un modèle distillé garde 100% des capacités du modèle prof.
- Oublier que la distillation demande énormément de données du modèle prof.
Mini-checklist
- Je vérifie d'abord si le mot désigne un concept, un outil, un risque ou une métrique.
- Je le relie à un cas concret : GPT-4 répond. On entraîne un petit modèle à reproduire ses réponses. Le petit devient presque aussi bon, pour 10× moins cher.
- Je garde en tête le piège principal : Confondre distillation et fine-tuning : ce n'est pas la même chose.
Questions rapides
C'est quoi Distillation en IA ?
La distillation entraîne un petit modèle à imiter un modèle plus puissant.
Où vais-je croiser Distillation ?
Tu la vois quand on cherche à réduire les coûts tout en gardant une qualité proche.
Quel mot lire après Distillation ?
Commence par Fine-tuning, Quantization, Modèle IA.