Modèle de diffusion : définition IA simple

Exemple concret

Midjourney part d'un bruit aléatoire et 'enlève le bruit' étape par étape pour révéler l'image que ton texte décrit. C'est la diffusion.

Pourquoi ça compte

C'est la techno derrière Midjourney, DALL-E, Stable Diffusion, Sora. Comprendre la diffusion, c'est lire la moitié des news image.

Tu le vois dans les outils de génération d'image et d'illustration.

À ne pas confondre

Multimodal : Un modèle multimodal accepte plusieurs types d'entrées, comme texte, image, audio ou vidéo.

Texte vers image : Le texte vers image génère une image à partir d'une consigne écrite.

Erreurs fréquentes

Confondre diffusion (génération) et vision (lecture).
Croire que diffusion = uniquement image (il y a aussi diffusion vidéo et audio).
Oublier que la diffusion est lente comparée à la génération de texte.

Mini-checklist

Je vérifie d'abord si le mot désigne un concept, un outil, un risque ou une métrique.
Je le relie à un cas concret : Midjourney part d'un bruit aléatoire et 'enlève le bruit' étape par étape pour révéler l'image que ton texte décrit. C'est la diffusion.
Je garde en tête le piège principal : Confondre diffusion (génération) et vision (lecture).

Questions rapides

C'est quoi Modèle de diffusion en IA ?

Un modèle de diffusion génère une image en partant d'un bruit aléatoire qu'il transforme progressivement jusqu'à obtenir le visuel décrit par le texte. C'est la technologie derrière Midjourney, DALL-E et Stable Diffusion.

Où vais-je croiser Modèle de diffusion ?

Tu le vois dans les outils de génération d'image et d'illustration.

Quel mot lire après Modèle de diffusion ?

Commence par Multimodal, Texte vers image, Génération vidéo.

Modèle de diffusion

Modèle de diffusion, en clair