Exemple concret
Midjourney part d'un bruit aléatoire et 'enlève le bruit' étape par étape pour révéler l'image que ton texte décrit. C'est la diffusion.
Pourquoi ça compte
C'est la techno derrière Midjourney, DALL-E, Stable Diffusion, Sora. Comprendre la diffusion, c'est lire la moitié des news image.
Tu le vois dans les outils de génération d'image et d'illustration.
À ne pas confondre
Multimodal : Un modèle multimodal accepte plusieurs types d'entrées, comme texte, image, audio ou vidéo.
Texte vers image : Le texte vers image génère une image à partir d'une consigne écrite.
Erreurs fréquentes
- Confondre diffusion (génération) et vision (lecture).
- Croire que diffusion = uniquement image (il y a aussi diffusion vidéo et audio).
- Oublier que la diffusion est lente comparée à la génération de texte.
Mini-checklist
- Je vérifie d'abord si le mot désigne un concept, un outil, un risque ou une métrique.
- Je le relie à un cas concret : Midjourney part d'un bruit aléatoire et 'enlève le bruit' étape par étape pour révéler l'image que ton texte décrit. C'est la diffusion.
- Je garde en tête le piège principal : Confondre diffusion (génération) et vision (lecture).
Questions rapides
C'est quoi Modèle de diffusion en IA ?
Un modèle de diffusion génère une image en partant du bruit puis en le transformant progressivement.
Où vais-je croiser Modèle de diffusion ?
Tu le vois dans les outils de génération d'image et d'illustration.
Quel mot lire après Modèle de diffusion ?
Commence par Multimodal, Texte vers image, Génération vidéo.