Les 12 bases · à lire avant de plonger dans le lexique
Si tu n'as jamais touché un terminal, le lexique peut sembler une montagne. Je t'ai sorti les 12 mots à comprendre en premier. Chacun avec une image mentale concrète. Aucun jargon. Tu lis ça d'abord, puis tu peux ouvrir n'importe quelle fiche du glossaire sans te sentir largué.
Si tu retiens ces 12 mots, le reste devient lisible
Je t'ai mis dans l'ordre où je les ai compris moi. D'abord ce qu'est un modèle (le cerveau). Ensuite comment on lui parle (prompt, token, contexte). Puis comment on muscle sa mémoire (embedding, vecteur, RAG, chunk). Enfin comment on lui donne des bras (agent, MCP, workflow). Et la grande peur du milieu : l'hallucination.
Lis les cards dans l'ordre. Si une image mentale ne te parle pas, ce n'est pas grave — l'explication d'après remet les choses en place. Et chaque card a un lien vers la fiche détaillée du lexique si tu veux creuser.
Le modèle, le prompt, le token, le contexte
Les 4 premiers mots. Tu peux faire 80 % de ce que tu vois sur LinkedIn avec juste ça.
Modèle (LLM)
Un cerveau qui a lu beaucoup de livres et retient surtout les liens entre les idées.
Quand tu utilises ChatGPT, Claude ou Gemini, tu parles à un modèle. Il ne sait rien sur toi par défaut, mais il a digéré une énorme quantité de texte et peut répondre comme un assistant cultivé.
Voir la fiche LLM →Prompt
La demande que tu fais à un assistant — précise et tu reçois du bon, vague et tu reçois du mou.
Un prompt, c'est juste le message que tu écris au modèle. La qualité de la réponse dépend à 70 % de la qualité de ta demande. Pas besoin de magie, juste être clair sur le contexte, le format et le résultat attendu.
Voir la fiche Prompt →Token
Des petits morceaux de Lego — le modèle ne lit pas des mots entiers, il lit des fragments.
Un token, c'est environ 3-4 caractères. Quand tu vois "1 000 tokens", compte à peu près 750 mots français. C'est important parce que tout se facture au token et que chaque modèle a une limite max par conversation.
Voir la fiche Token →Contexte
La mémoire de travail d'un assistant — il n'a en tête que ce que tu lui as dit dans la conversation en cours.
Le contexte, c'est tout ce que le modèle "voit" pendant qu'il te répond : ta demande, l'historique, les fichiers que tu lui as donnés. Trop court il oublie le début. Trop long il se perd ou ça devient cher.
Voir la fiche Contexte →L'hallucination, l'embedding, le vecteur, le RAG
Le modèle peut inventer avec aplomb. Heureusement, on sait lui apprendre à consulter tes documents avant de répondre. Voici comment.
Hallucination
Un collègue qui invente une réponse avec une assurance totale plutôt que d'avouer qu'il ne sait pas.
Le modèle est conçu pour produire la suite la plus probable d'un texte. S'il ne sait pas, il peut sortir une réponse fausse qui sonne vraie. C'est LE risque numéro un. La parade : lui faire citer ses sources et vérifier.
Voir la fiche Hallucination →Embedding
L'empreinte digitale du sens d'un texte — deux phrases proches en sens ont des empreintes proches.
Un embedding, c'est une longue suite de nombres qui capture la signification d'un texte. Tu n'as pas besoin de la lire toi, mais c'est ce qui permet à une machine de dire "ces deux paragraphes parlent du même sujet".
Voir la fiche Embedding →Vecteur / base vectorielle
Un classeur intelligent qui range tes documents par thème — pas par ordre alphabétique, par sens.
Une base vectorielle stocke tous les embeddings de tes documents. Quand tu poses une question, elle retrouve les passages les plus proches en sens. C'est l'outil derrière toutes les "IA qui connaissent mes documents".
Voir la fiche Base vectorielle →RAG
Un assistant qui consulte tes archives avant de répondre — au lieu d'inventer, il va chercher.
RAG (Retrieval Augmented Generation) = on cherche d'abord les bons passages dans tes documents, puis on demande au modèle de répondre avec ces passages sous les yeux. C'est la parade la plus efficace contre les hallucinations.
Voir la fiche RAG →L'agent, le MCP, le workflow, le chunk
Un modèle qui répond, c'est gentil. Un modèle qui agit, c'est utile. Voici comment on lui donne des outils, un plan, et comment on découpe les gros documents qu'il doit lire.
Agent
Un stagiaire autonome — tu lui donnes une mission et il enchaîne les étapes sans que tu valides chaque clic.
Un agent, c'est un modèle qui peut utiliser des outils (envoyer un email, lire un fichier, faire une recherche web) et boucler tant que la tâche n'est pas finie. C'est ce qui transforme un chatbot en collaborateur.
Voir la fiche Agent →MCP
Une prise jack universelle — branche n'importe quel outil au modèle, sans recoder la connexion à chaque fois.
MCP (Model Context Protocol) est un standard ouvert pour qu'un modèle puisse parler à tes outils (Gmail, Notion, ta base de données) de façon propre. Tu installes un serveur MCP, le modèle a accès à l'outil. C'est le USB de l'IA.
Voir la fiche MCP →Workflow
Une recette de cuisine fixe, à l'opposé d'un cuisinier qui improvise — chaque étape est définie à l'avance.
Un workflow IA, c'est une suite d'étapes prédéfinies (étape A → puis B → puis C). Plus fiable et moins cher qu'un agent autonome, mais moins flexible. Pour 80 % des cas business, le workflow est le bon choix.
Voir la fiche Workflow →Chunk
Déchirer un livre en morceaux digestes pour que le modèle puisse les avaler un par un.
Un modèle ne peut pas lire un PDF de 300 pages d'un coup (le contexte n'est pas assez grand, ou ça coûte trop cher). Donc on découpe en morceaux (chunks) de quelques paragraphes chacun. C'est l'étape juste avant de créer les embeddings.
Voir la fiche Chunk →Maintenant tu peux explorer le lexique complet
Tu as la carte. Tu peux ouvrir n'importe quelle fiche du glossaire A-Z sans te sentir perdu. Et si un mot te coince, reviens ici — il est sûrement parmi les 12 bases.
Ouvrir le glossaire A-Z