Les travaux
de Karpathy,
vulgarisés.
Andrej Karpathy, c'est probablement le meilleur prof d'IA du monde aujourd'hui. Ex-directeur IA chez Tesla, co-fondateur OpenAI. Mais surtout : le seul à prendre le temps de t'expliquer comment tout ça marche vraiment, sans jargon. Je te résume ce qu'il t'apprend — même si tu n'es pas dev.
Ce que tu vas apprendre
- Qui est Karpathy et pourquoi il compte autant dans le monde de l'IA
- Les 3 concepts clés qu'il explique et que tu peux comprendre sans être dev
- Les 4 ressources essentielles à regarder / lire (dans quel ordre, combien de temps)
- Un LLM = simulateur de texte qui prédit le mot suivant. C'est pour ça qu'il peut halluciner : il invente ce qui "sonne juste" même quand il ne sait pas.
- Un token = unité de comptage. Le français utilise 1,5× à 2× plus de tokens que l'anglais pour dire la même chose. Ta facture IA dépend de ça.
- Le prompt engineering = discipline, pas magie. Un bon prompt sur un modèle moyen bat un mauvais prompt sur le meilleur modèle.
- Transparence : article écrit avec Claude (Anthropic), relu et validé par moi. Si tu repères une erreur ou un passage qui sonne faux, écris-moi, je corrige.
Qui est Andrej Karpathy ?
Karpathy, c'est le parcours le plus impressionnant de l'IA moderne. PhD à Stanford (doctorat en intelligence artificielle) avec Fei-Fei Li. Co-fondateur d'OpenAI en 2015. Directeur IA chez Tesla pendant 5 ans (responsable de l'Autopilot). Puis retour chez OpenAI avant de partir en 2024 pour fonder sa startup Eureka Labs, dédiée à l'éducation IA.
Mais ce qui le rend unique, ce n'est pas son CV. C'est son obsession : rendre l'IA compréhensible pour tout le monde. Pendant que les autres gardent leurs secrets, lui publie des cours YouTube gratuits de 4 heures, ouvre le code sur GitHub (la plateforme de partage de code), explique comment entraîner un GPT depuis zéro avec un cahier et un stylo.
Pourquoi je le suis
Je ne suis pas dev. Mais quand Karpathy explique comment fonctionne un LLM, je comprends. Tout devient limpide. C'est le seul à m'avoir fait vraiment saisir ce qui se passe sous le capot de ChatGPT. Après ses vidéos, tu ne prompts plus pareil — tu comprends pourquoi tel prompt marche et tel autre non.
Ce qu'il t'apprend vraiment.
Karpathy dit beaucoup de choses. Voici les 3 idées que, moi, j'en retiens — celles qui m'ont le plus marqué et qui ont changé ma façon de voir l'IA.
Un LLM, c'est un "simulateur de texte"
La métaphore favorite de Karpathy : un LLM ne "pense" pas, il imite. Il a lu des milliards de pages web et il devine, pour chaque mot, ce qui vient ensuite. Point. Pas de conscience, pas de raisonnement au sens humain — juste une machine à prédire le mot suivant, incroyablement bien calibrée.
Pourquoi c'est utile pour toi : ça explique pourquoi un LLM hallucine (il invente ce qui "sonne juste" même si c'est faux), pourquoi il est meilleur sur les sujets bien représentés dans ses données d'entraînement, et pourquoi un bon prompt lui donne le ton juste dès le départ.
L'importance des "tokens"
Un LLM ne voit pas des mots. Il voit des tokens — des morceaux de mots. "chat" c'est 1 token, "anticonstitutionnellement" c'est 6 tokens. Chaque token a un coût (temps + argent).
Pourquoi c'est utile pour toi : tu comprends pourquoi certaines langues coûtent plus cher (le français utilise plus de tokens que l'anglais), pourquoi un long prompt avec beaucoup de contexte t'explose ta facture, et pourquoi il vaut souvent mieux résumer que détailler quand tu prompts.
Software 3.0 : tu programmes l'IA en français
Son concept-phare depuis 2025 (talk YC AI Startup School, juin 2025 — YC = Y Combinator, l'incubateur de startups). Il découpe l'histoire du logiciel en 3 ères : Software 1.0 = on écrit du code, Software 2.0 = on entraîne des réseaux de neurones (on écrit des poids, pas du code), Software 3.0 = on programme les LLM en anglais (ou français). Un prompt (l'instruction qu'on tape à l'IA) bien écrit est un programme.
Pourquoi c'est utile pour toi : tu n'as pas besoin de savoir coder pour "programmer" une IA. Un prompt structuré — contexte, rôle, format, exemples — c'est littéralement du code en français. Les gens qui maîtrisent ça sortent 10× plus de valeur que ceux qui envoient des demandes vagues.
Ce qu'il dit en 2025-2026 (au-delà de ces 3 idées)
Karpathy évolue vite. Ses concepts récents valent le détour :
- Vibe coding (février 2025) — "oublie le code, laisse l'IA coder, toi tu vibe" (en clair : tu décris ce que tu veux, l'IA pond le code) : le concept qui a fait exploser Cursor, Lovable, Bolt.
- LLM OS — imaginer le LLM comme le cœur d'un nouveau système d'exploitation à la Windows ou macOS (le contexte = RAM, les embeddings = disque dur — les embeddings, c'est la mémoire compressée des textes que l'IA a lus, les outils = périphériques).
- Jagged intelligence (en clair : intelligence "en dents de scie") — les IA sont "brillantes sur X, nulles sur Y", et incapables de consolider ce qu'elles apprennent. Utile pour tempérer l'hype (le buzz exagéré).
- "Decade of agents, not year of agents" — les agents IA autonomes sont une décennie de chantier, pas une année. Pousse à construire avec du human-in-the-loop (l'humain reste dans la boucle pour valider) à la Cursor, pas à tout automatiser.
Ce que ça change pour ton business.
Les 3 idées au-dessus, traduites en actions que tu peux lancer cette semaine — peu importe ton métier.
Coach / consultant
Arrête d'envoyer des prompts à 3 lignes. Écris-les comme un cahier des charges : contexte, rôle, format attendu, exemples. Tes résultats Claude vont changer de niveau. Un prompt de 20 lignes bien structuré te sort un livrable 10× meilleur qu'une demande vague.
E-commerçant
Avant de rédiger tes 500 descriptions produits, fais le calcul tokens. 500 descriptions × 2 000 tokens = 1M tokens. À 3$ le million (Claude Sonnet), ça te coûte 3$. Pas 300$. Arrête d'avoir peur du prix — teste, mesure, scale.
Agence / créa
Ton équipe dit que Claude "hallucine" ? Normal : il simule. Donne-lui des sources + demande-lui de citer. Il hallucine beaucoup moins quand il sait qu'il doit justifier. Règle maison : pas de réponse sans citation de la source dans le prompt.
Les 4 ressources essentielles.
Voici son contenu, du plus accessible au plus pointu. Tu n'as pas besoin de tout regarder — choisis ce qui te parle.
Pas le temps pour 15h de vidéos ?
Regarde juste Deep Dive into LLMs like ChatGPT (3h31, février 2025) — c'est sa vidéo grand public la plus à jour et la plus complète. Si tu n'as qu'une heure, prends l'Intro to LLMs (1h, 2023). Si ça t'accroche, tu enchaîneras les autres naturellement.
Voici les 4 ressources en un coup d'œil pour choisir selon ton temps et ton niveau.
| Ressource | Durée | Niveau | Prérequis | Format |
|---|---|---|---|---|
| Intro to LLMs | 1 h | Débutant | Aucun | Conférence vulgarisée |
| Let's build GPT from scratch | ~2 h | Intermédiaire | Lire du Python | Code-along |
| Neural Networks Zero to Hero (8 vidéos) | ~14 h 40 | Avancé | Python + maths de base | Code-along (série) |
| Compte X @karpathy | En continu | Tous niveaux | Aucun | Posts + threads |
1h d'explication grand public sur "c'est quoi un LLM, comment ça marche, où ça va". Aucune ligne de code. Juste pour comprendre les bases. Si tu dois regarder une seule vidéo de Karpathy, c'est celle-là.
Regarder sur YouTube →2h où il code un mini-GPT en Python depuis zéro, ligne par ligne, en expliquant chaque concept. Tu ressors avec une compréhension technique de comment un GPT fonctionne vraiment. Accessible si tu lis du code simple, pas besoin d'être senior.
Regarder sur YouTube →Une série de 8 vidéos (56 min à 2h25 chacune, ~14h40 au total) qui part de "c'est quoi un neurone" jusqu'à construire GPT-2 complet. La référence absolue pour comprendre l'IA moderne. Intense mais exceptionnelle.
Regarder la playlist →Karpathy poste régulièrement des réflexions sur l'IA, des threads sur ce qu'il teste, des prises de position. Un des comptes les plus denses en signal de l'écosystème. Il est aussi sur GitHub avec nanoGPT, llm.c et plus récemment nanochat (octobre 2025) — un repo (un dépôt de code public) qui entraîne un ChatGPT complet pour ~100$ de compute cloud (location de puissance de calcul à distance).
Voir son X →Mon conseil d'ordre
(1) Regarde Deep Dive into LLMs (3h31, 2025) en premier — c'est la vidéo grand public la plus à jour. Ou Intro to LLMs (1h, 2023) si tu as moins de temps. (2) Si tu accroches, lance-toi sur Let's build GPT (1h56) pour comprendre techniquement. (3) Et si tu es vraiment passionné, attaque la série Zero to Hero. Pas besoin de tout voir — chaque vidéo est indépendamment utile.
Ce qu'il construit maintenant.
Depuis 2024, Karpathy a quitté OpenAI pour fonder Eureka Labs, une startup qui construit "le premier AI-native school". L'idée : un prof IA qui t'accompagne sur un cours, adapté à ton rythme, avec des retours personnalisés.
Leur premier cours, LLM101n, est en construction publique sur GitHub. Le but : apprendre à construire un LLM depuis zéro, accompagné d'un tuteur IA. Une vision qui matche totalement son obsession — vulgariser l'IA à grande échelle.
Pourquoi ça m'intéresse
Si Eureka Labs réussit, ça change l'éducation. Un prof IA disponible 24/7, gratuit ou quasi, qui s'adapte à ton niveau — c'est exactement ce que beaucoup de gens attendent. Karpathy construit actuellement LLM101n : Let's Build a Storyteller, un cours complet sur comment construire un LLM de A à Z. Il partage l'avancée en public sur son GitHub. Pas de date de sortie officielle, mais tout le travail est visible en live sur le repo.
Pour creuser : 2 articles complémentaires
Si tu veux voir comment j'applique concrètement les idées de Karpathy : les agents auto-améliorants (un workflow inspiré de son approche) et le LLM Wiki, ton deuxième cerveau (la mémoire externe d'un agent à la sauce Karpathy). Et si tu veux faire tourner ses idées en local : comment installer une IA chez toi sans coder.
FAQ Karpathy.
Qui est Andrej Karpathy en deux phrases ?
Chercheur et vulgarisateur en IA, PhD à Stanford avec Fei-Fei Li, cofondateur d'OpenAI en 2015 et ex-directeur IA de Tesla pendant cinq ans (responsable de l'Autopilot). Depuis 2024, il a fondé Eureka Labs, une startup qui construit le premier AI-native school avec un tuteur IA intégré.
Par quelle vidéo commencer si je débute ?
Si tu as une heure, regarde Intro to Large Language Models (1h, 2023) : aucun code, juste comprendre ce qu'est un LLM. Si tu as trois heures, prends Deep Dive into LLMs like ChatGPT (3h31, février 2025) : c'est sa vidéo grand public la plus à jour et la plus complète.
Combien de temps pour la série Zero to Hero ?
La série complète fait 8 vidéos pour environ 14h40 cumulées (de 56 minutes à 2h25 par vidéo). Chaque vidéo est indépendamment utile : tu n'as pas besoin de tout regarder. Pour comprendre un transformer en profondeur, les 4 premières suffisent (~ 8 heures).
C'est quoi Software 3.0 ?
C'est son concept-phare depuis le talk YC AI Startup School (juin 2025). Trois ères : Software 1.0 = écrire du code, Software 2.0 = entraîner des réseaux de neurones, Software 3.0 = programmer les LLM en français ou en anglais. Un prompt bien écrit est littéralement un programme.
C'est quoi le LLM OS ?
Sa métaphore pour penser le LLM comme le cœur d'un nouveau système d'exploitation. Le contexte joue le rôle de la RAM, les embeddings celui du disque dur, les outils accessibles au modèle celui des périphériques. Cadre utile pour construire des agents IA qui ressemblent à un OS plutôt qu'à un chatbot.
C'est quoi le vibe coding ?
Concept lancé par Karpathy en février 2025 sur X : tu décris ce que tu veux, l'IA pond le code, toi tu valides à l'œil et au feeling. C'est le concept qui a fait exploser Cursor, Lovable et Bolt. Le développeur devient chef d'orchestre plus que pianiste.
Pourquoi Karpathy a quitté OpenAI ?
Il a quitté OpenAI en février 2024 pour fonder Eureka Labs, une startup dédiée à l'éducation IA. Sa vision : un cours où un tuteur IA accompagne chaque élève à son rythme, avec retours personnalisés. Premier cours en construction publique : LLM101n, Let's Build a Storyteller.
Karpathy parle français ?
Non, toutes ses vidéos sont en anglais. Mais YouTube génère des sous-titres français automatiques de bonne qualité. Active-les via le bouton CC en bas du lecteur, puis roue dentée → sous-titres → traduire automatiquement → français.
C'est quoi nanochat, son projet d'octobre 2025 ?
Un dépôt GitHub qui montre comment entraîner un ChatGPT complet pour ~100 dollars de compute cloud. Suite de nanoGPT et llm.c. Objectif éducatif : démystifier l'entraînement d'un LLM en montrant chaque ligne de code.
Pourquoi il explique mieux qu'un cours universitaire ?
Trois ingrédients : (1) il code en direct au lieu de montrer des slides, (2) il part toujours d'un cas concret avant la théorie (un LLM qui prédit un mot, pas un transformer abstrait), (3) il assume les pannes, refait, explique pourquoi. L'université vise la rigueur exhaustive, Karpathy vise la compréhension intuitive.
Tu repères une erreur ?
Une info obsolète, un chiffre qui a bougé, une source périmée ? Écris-moi à sagnier.jeremy@gmail.com · je corrige en 48h max et je note la date de MAJ en haut de l'article. Les retours terrain valent mille fois les articles — je lis tout, je réponds.
Les prochains articles arrivent.
J'ai prévu d'autres vulgarisations : Yann LeCun, Ilya Sutskever, les transformers. Si tu ne veux pas les louper, inscris-toi à ma newsletter AI Playbook — chaque nouveau tuto y atterrit.
Voir les newsletters →