C'est quoi le LLM OS imaginé par Karpathy ?

Le LLM OS est sa métaphore pour penser le LLM comme le cœur d'un nouveau système d'exploitation. Le contexte joue le rôle de la RAM, les embeddings (la mémoire compressée des textes lus) celui du disque dur, et les outils accessibles au modèle celui des périphériques. Cadre très utile pour construire des agents IA qui ressemblent à un OS plutôt qu'à un chatbot.

Karpathy parle français dans ses vidéos ?

Non, toutes ses vidéos sont en anglais. Mais YouTube génère des sous-titres français automatiques de bonne qualité sur la quasi-totalité de ses contenus. Active-les via le bouton CC en bas du lecteur, puis paramètres roue dentée → sous-titres → traduire automatiquement → français.

Tuto · 03 · IA & Outils

Les travaux
de Karpathy,
vulgarisés.

Q: Qui est Andrej Karpathy en deux phrases ?

Andrej Karpathy est un chercheur et vulgarisateur en intelligence artificielle, PhD à Stanford avec Fei-Fei Li, cofondateur d'OpenAI en 2015 et ex-directeur IA de Tesla pendant cinq ans (responsable de l'Autopilot). Depuis 2024, il a fondé Eureka Labs, une startup qui construit le premier AI-native school avec un tuteur IA intégré.

Q: Par quelle vidéo de Karpathy commencer si je débute ?

Si tu as une heure, regarde Intro to Large Language Models (1h, 2023) : aucun code, juste comprendre ce qu'est un LLM. Si tu as trois heures, prends Deep Dive into LLMs like ChatGPT (3h31, février 2025) : c'est sa vidéo grand public la plus à jour et la plus complète.

Q: Combien de temps faut-il pour la série Neural Networks Zero to Hero ?

La série complète fait 8 vidéos pour environ 14h40 cumulées (de 56 minutes à 2h25 par vidéo). Chaque vidéo est indépendamment utile : tu n'as pas besoin de tout regarder. Pour comprendre un transformer en profondeur, les 4 premières suffisent (environ 8 heures).

Q: C'est quoi Software 3.0 selon Karpathy ?

Software 3.0 est le concept-phare de Karpathy depuis son talk YC AI Startup School (juin 2025). Il découpe l'histoire du logiciel en 3 ères : Software 1.0 = écrire du code, Software 2.0 = entraîner des réseaux de neurones (on ajuste des poids, pas du code), Software 3.0 = programmer les LLM en français ou en anglais. Un prompt bien écrit est littéralement un programme.

Q: C'est quoi le vibe coding ?

Vibe coding est le concept lancé par Karpathy en février 2025 sur X : tu décris ce que tu veux à voix haute ou en texte, l'IA pond le code, toi tu valides à l'œil et au feeling. C'est le concept qui a fait exploser Cursor, Lovable et Bolt. Le développeur devient chef d'orchestre plus que pianiste.

Q: Pourquoi Karpathy a quitté OpenAI ?

Karpathy a quitté OpenAI en février 2024 pour fonder Eureka Labs, une startup dédiée à l'éducation IA. Sa vision : un cours où un tuteur IA accompagne chaque élève à son rythme, avec retours personnalisés. Premier cours en construction publique sur GitHub : LLM101n, Let's Build a Storyteller — apprendre à construire un LLM depuis zéro.

Q: C'est quoi nanochat, son projet d'octobre 2025 ?

nanochat est un dépôt GitHub publié par Karpathy en octobre 2025 qui montre comment entraîner un ChatGPT complet pour environ 100 dollars de compute cloud (location de puissance de calcul à distance). C'est la suite de nanoGPT et llm.c. Objectif éducatif : démystifier l'entraînement d'un LLM en montrant chaque ligne de code.

Q: Comment Karpathy explique-t-il mieux qu'un cours universitaire ?

Trois ingrédients : (1) il code en direct au lieu de montrer des slides, (2) il part toujours d'un cas concret avant la théorie (un LLM qui prédit un mot, pas un transformer abstrait), (3) il assume les pannes, refait, explique pourquoi. Un cours universitaire vise la rigueur exhaustive ; Karpathy vise la compréhension intuitive. Les deux sont complémentaires.

Andrej Karpathy, c'est probablement le meilleur prof d'IA du monde aujourd'hui. Ex-directeur IA chez Tesla, co-fondateur OpenAI. Mais surtout : le seul à prendre le temps de t'expliquer comment tout ça marche vraiment, sans jargon. Je te résume ce qu'il t'apprend — même si tu n'es pas dev.

15 min de lecture Niveau Débutant OK Pré-requis Zéro

Jérémy Sagnier · Je teste l’IA tous les jours · Je partage ce qui m’a servi Publié 8 avril 2026 · MAJ 20 avril 2026

En 30 secondes

Ce que tu vas apprendre

Qui est Karpathy et pourquoi il compte autant dans le monde de l'IA
Les 3 concepts clés qu'il explique et que tu peux comprendre sans être dev
Les 4 ressources essentielles à regarder / lire (dans quel ordre, combien de temps)

Les 3 idées à retenir en 30 secondes

Un LLM = simulateur de texte qui prédit le mot suivant. C'est pour ça qu'il peut halluciner : il invente ce qui "sonne juste" même quand il ne sait pas.
Un token = unité de comptage. Le français utilise 1,5× à 2× plus de tokens que l'anglais pour dire la même chose. Ta facture IA dépend de ça.
Le prompt engineering = discipline, pas magie. Un bon prompt sur un modèle moyen bat un mauvais prompt sur le meilleur modèle.

Transparence : article écrit avec Claude (Anthropic), relu et validé par moi. Si tu repères une erreur ou un passage qui sonne faux, écris-moi, je corrige.

— Le profil

Qui est Andrej Karpathy ?

Karpathy, c'est le parcours le plus impressionnant de l'IA moderne. PhD à Stanford (doctorat en intelligence artificielle) avec Fei-Fei Li. Co-fondateur d'OpenAI en 2015. Directeur IA chez Tesla pendant 5 ans (responsable de l'Autopilot). Puis retour chez OpenAI avant de partir en 2024 pour fonder sa startup Eureka Labs, dédiée à l'éducation IA.

Mais ce qui le rend unique, ce n'est pas son CV. C'est son obsession : rendre l'IA compréhensible pour tout le monde. Pendant que les autres gardent leurs secrets, lui publie des cours YouTube gratuits de 4 heures, ouvre le code sur GitHub (la plateforme de partage de code), explique comment entraîner un GPT depuis zéro avec un cahier et un stylo.

Pourquoi je le suis

Je ne suis pas dev. Mais quand Karpathy explique comment fonctionne un LLM, je comprends. Tout devient limpide. C'est le seul à m'avoir fait vraiment saisir ce qui se passe sous le capot de ChatGPT. Après ses vidéos, tu ne prompts plus pareil — tu comprends pourquoi tel prompt marche et tel autre non.

— Les 3 idées que j'en retiens

Ce qu'il t'apprend vraiment.

Karpathy dit beaucoup de choses. Voici les 3 idées que, moi, j'en retiens — celles qui m'ont le plus marqué et qui ont changé ma façon de voir l'IA.

Un LLM, c'est un "simulateur de texte"

La métaphore favorite de Karpathy : un LLM ne "pense" pas, il imite. Il a lu des milliards de pages web et il devine, pour chaque mot, ce qui vient ensuite. Point. Pas de conscience, pas de raisonnement au sens humain — juste une machine à prédire le mot suivant, incroyablement bien calibrée.

Pourquoi c'est utile pour toi : ça explique pourquoi un LLM hallucine (il invente ce qui "sonne juste" même si c'est faux), pourquoi il est meilleur sur les sujets bien représentés dans ses données d'entraînement, et pourquoi un bon prompt lui donne le ton juste dès le départ.

L'importance des "tokens"

Un LLM ne voit pas des mots. Il voit des tokens — des morceaux de mots. "chat" c'est 1 token, "anticonstitutionnellement" c'est 6 tokens. Chaque token a un coût (temps + argent).

Pourquoi c'est utile pour toi : tu comprends pourquoi certaines langues coûtent plus cher (le français utilise plus de tokens que l'anglais), pourquoi un long prompt avec beaucoup de contexte t'explose ta facture, et pourquoi il vaut souvent mieux résumer que détailler quand tu prompts.

Software 3.0 : tu programmes l'IA en français

Son concept-phare depuis 2025 (talk YC AI Startup School, juin 2025 — YC = Y Combinator, l'incubateur de startups). Il découpe l'histoire du logiciel en 3 ères : Software 1.0 = on écrit du code, Software 2.0 = on entraîne des réseaux de neurones (on écrit des poids, pas du code), Software 3.0 = on programme les LLM en anglais (ou français). Un prompt (l'instruction qu'on tape à l'IA) bien écrit est un programme.

Software 1.0 → 2.0 → 3.0 : trois langages, trois écrans, trois ères de programmation selon Karpathy.

Pourquoi c'est utile pour toi : tu n'as pas besoin de savoir coder pour "programmer" une IA. Un prompt structuré — contexte, rôle, format, exemples — c'est littéralement du code en français. Les gens qui maîtrisent ça sortent 10× plus de valeur que ceux qui envoient des demandes vagues.

Ce qu'il dit en 2025-2026 (au-delà de ces 3 idées)

Karpathy évolue vite. Ses concepts récents valent le détour :

Vibe coding (février 2025) — "oublie le code, laisse l'IA coder, toi tu vibe" (en clair : tu décris ce que tu veux, l'IA pond le code) : le concept qui a fait exploser Cursor, Lovable, Bolt.
LLM OS — imaginer le LLM comme le cœur d'un nouveau système d'exploitation à la Windows ou macOS (le contexte = RAM, les embeddings = disque dur — les embeddings, c'est la mémoire compressée des textes que l'IA a lus, les outils = périphériques).
Jagged intelligence (en clair : intelligence "en dents de scie") — les IA sont "brillantes sur X, nulles sur Y", et incapables de consolider ce qu'elles apprennent. Utile pour tempérer l'hype (le buzz exagéré).
"Decade of agents, not year of agents" — les agents IA autonomes sont une décennie de chantier, pas une année. Pousse à construire avec du human-in-the-loop (l'humain reste dans la boucle pour valider) à la Cursor, pas à tout automatiser.

— Concret

Ce que ça change pour ton business.

Les 3 idées au-dessus, traduites en actions que tu peux lancer cette semaine — peu importe ton métier.

Coach / consultant

Arrête d'envoyer des prompts à 3 lignes. Écris-les comme un cahier des charges : contexte, rôle, format attendu, exemples. Tes résultats Claude vont changer de niveau. Un prompt de 20 lignes bien structuré te sort un livrable 10× meilleur qu'une demande vague.

E-commerçant

Avant de rédiger tes 500 descriptions produits, fais le calcul tokens. 500 descriptions × 2 000 tokens = 1M tokens. À 3$ le million (Claude Sonnet), ça te coûte 3$. Pas 300$. Arrête d'avoir peur du prix — teste, mesure, scale.

Agence / créa

Ton équipe dit que Claude "hallucine" ? Normal : il simule. Donne-lui des sources + demande-lui de citer. Il hallucine beaucoup moins quand il sait qu'il doit justifier. Règle maison : pas de réponse sans citation de la source dans le prompt.

— Par où commencer

Les 4 ressources essentielles.

Voici son contenu, du plus accessible au plus pointu. Tu n'as pas besoin de tout regarder — choisis ce qui te parle.

Pas le temps pour 15h de vidéos ?

Regarde juste Deep Dive into LLMs like ChatGPT (3h31, février 2025) — c'est sa vidéo grand public la plus à jour et la plus complète. Si tu n'as qu'une heure, prends l'Intro to LLMs (1h, 2023). Si ça t'accroche, tu enchaîneras les autres naturellement.

Voici les 4 ressources en un coup d'œil pour choisir selon ton temps et ton niveau.

Ressource	Durée	Niveau	Prérequis	Format
Intro to LLMs	1 h	Débutant	Aucun	Conférence vulgarisée
Let's build GPT from scratch	~2 h	Intermédiaire	Lire du Python	Code-along
Neural Networks Zero to Hero (8 vidéos)	~14 h 40	Avancé	Python + maths de base	Code-along (série)
Compte X @karpathy	En continu	Tous niveaux	Aucun	Posts + threads

01 · Pour comprendre (débutant)

Intro to Large Language Models

1h d'explication grand public sur "c'est quoi un LLM, comment ça marche, où ça va". Aucune ligne de code. Juste pour comprendre les bases. Si tu dois regarder une seule vidéo de Karpathy, c'est celle-là.

● 1h · YouTube · Grand public

Regarder sur YouTube →

02 · Pour comprendre + pratiquer (avancé)

Let's build GPT from scratch

2h où il code un mini-GPT en Python depuis zéro, ligne par ligne, en expliquant chaque concept. Tu ressors avec une compréhension technique de comment un GPT fonctionne vraiment. Accessible si tu lis du code simple, pas besoin d'être senior.

● 2h · YouTube · Code Python

Regarder sur YouTube →

03 · Pour creuser à fond

Neural Networks : Zero to Hero (série)

Une série de 8 vidéos (56 min à 2h25 chacune, ~14h40 au total) qui part de "c'est quoi un neurone" jusqu'à construire GPT-2 complet. La référence absolue pour comprendre l'IA moderne. Intense mais exceptionnelle.

● ~14h40 · YouTube · 8 vidéos

Regarder la playlist →

04 · Pour suivre ses pensées

Son compte X @karpathy

Karpathy poste régulièrement des réflexions sur l'IA, des threads sur ce qu'il teste, des prises de position. Un des comptes les plus denses en signal de l'écosystème. Il est aussi sur GitHub avec nanoGPT, llm.c et plus récemment nanochat (octobre 2025) — un repo (un dépôt de code public) qui entraîne un ChatGPT complet pour ~100$ de compute cloud (location de puissance de calcul à distance).

● Compte X · Posts réguliers

Voir son X →

Mon conseil d'ordre

(1) Regarde Deep Dive into LLMs (3h31, 2025) en premier — c'est la vidéo grand public la plus à jour. Ou Intro to LLMs (1h, 2023) si tu as moins de temps. (2) Si tu accroches, lance-toi sur Let's build GPT (1h56) pour comprendre techniquement. (3) Et si tu es vraiment passionné, attaque la série Zero to Hero. Pas besoin de tout voir — chaque vidéo est indépendamment utile.

— Eureka Labs

Ce qu'il construit maintenant.

Depuis 2024, Karpathy a quitté OpenAI pour fonder Eureka Labs, une startup qui construit "le premier AI-native school". L'idée : un prof IA qui t'accompagne sur un cours, adapté à ton rythme, avec des retours personnalisés.

Leur premier cours, LLM101n, est en construction publique sur GitHub. Le but : apprendre à construire un LLM depuis zéro, accompagné d'un tuteur IA. Une vision qui matche totalement son obsession — vulgariser l'IA à grande échelle.

Pourquoi ça m'intéresse

Si Eureka Labs réussit, ça change l'éducation. Un prof IA disponible 24/7, gratuit ou quasi, qui s'adapte à ton niveau — c'est exactement ce que beaucoup de gens attendent. Karpathy construit actuellement LLM101n : Let's Build a Storyteller, un cours complet sur comment construire un LLM de A à Z. Il partage l'avancée en public sur son GitHub. Pas de date de sortie officielle, mais tout le travail est visible en live sur le repo.

Pour creuser : 2 articles complémentaires

Si tu veux voir comment j'applique concrètement les idées de Karpathy : les agents auto-améliorants (un workflow inspiré de son approche) et le LLM Wiki, ton deuxième cerveau (la mémoire externe d'un agent à la sauce Karpathy). Et si tu veux faire tourner ses idées en local : comment installer une IA chez toi sans coder.

— Questions fréquentes

FAQ Karpathy.

Qui est Andrej Karpathy en deux phrases ?

Chercheur et vulgarisateur en IA, PhD à Stanford avec Fei-Fei Li, cofondateur d'OpenAI en 2015 et ex-directeur IA de Tesla pendant cinq ans (responsable de l'Autopilot). Depuis 2024, il a fondé Eureka Labs, une startup qui construit le premier AI-native school avec un tuteur IA intégré.

Par quelle vidéo commencer si je débute ?

Si tu as une heure, regarde Intro to Large Language Models (1h, 2023) : aucun code, juste comprendre ce qu'est un LLM. Si tu as trois heures, prends Deep Dive into LLMs like ChatGPT (3h31, février 2025) : c'est sa vidéo grand public la plus à jour et la plus complète.

Combien de temps pour la série Zero to Hero ?

La série complète fait 8 vidéos pour environ 14h40 cumulées (de 56 minutes à 2h25 par vidéo). Chaque vidéo est indépendamment utile : tu n'as pas besoin de tout regarder. Pour comprendre un transformer en profondeur, les 4 premières suffisent (~ 8 heures).

C'est quoi Software 3.0 ?

C'est son concept-phare depuis le talk YC AI Startup School (juin 2025). Trois ères : Software 1.0 = écrire du code, Software 2.0 = entraîner des réseaux de neurones, Software 3.0 = programmer les LLM en français ou en anglais. Un prompt bien écrit est littéralement un programme.

C'est quoi le LLM OS ?

Sa métaphore pour penser le LLM comme le cœur d'un nouveau système d'exploitation. Le contexte joue le rôle de la RAM, les embeddings celui du disque dur, les outils accessibles au modèle celui des périphériques. Cadre utile pour construire des agents IA qui ressemblent à un OS plutôt qu'à un chatbot.

C'est quoi le vibe coding ?

Concept lancé par Karpathy en février 2025 sur X : tu décris ce que tu veux, l'IA pond le code, toi tu valides à l'œil et au feeling. C'est le concept qui a fait exploser Cursor, Lovable et Bolt. Le développeur devient chef d'orchestre plus que pianiste.

Pourquoi Karpathy a quitté OpenAI ?

Il a quitté OpenAI en février 2024 pour fonder Eureka Labs, une startup dédiée à l'éducation IA. Sa vision : un cours où un tuteur IA accompagne chaque élève à son rythme, avec retours personnalisés. Premier cours en construction publique : LLM101n, Let's Build a Storyteller.

Karpathy parle français ?

Non, toutes ses vidéos sont en anglais. Mais YouTube génère des sous-titres français automatiques de bonne qualité. Active-les via le bouton CC en bas du lecteur, puis roue dentée → sous-titres → traduire automatiquement → français.

C'est quoi nanochat, son projet d'octobre 2025 ?

Un dépôt GitHub qui montre comment entraîner un ChatGPT complet pour ~100 dollars de compute cloud. Suite de nanoGPT et llm.c. Objectif éducatif : démystifier l'entraînement d'un LLM en montrant chaque ligne de code.

Pourquoi il explique mieux qu'un cours universitaire ?

Trois ingrédients : (1) il code en direct au lieu de montrer des slides, (2) il part toujours d'un cas concret avant la théorie (un LLM qui prédit un mot, pas un transformer abstrait), (3) il assume les pannes, refait, explique pourquoi. L'université vise la rigueur exhaustive, Karpathy vise la compréhension intuitive.

✉

Tu repères une erreur ?

Une info obsolète, un chiffre qui a bougé, une source périmée ? Écris-moi à sagnier.jeremy@gmail.com · je corrige en 48h max et je note la date de MAJ en haut de l'article. Les retours terrain valent mille fois les articles — je lis tout, je réponds.

Merci d'avoir lu jusqu'ici 👋

On continue ensemble ?

Je teste l'IA pour de vrai et je partage ce qui marche, sans jargon ni hype. Si cet article t'a servi, le plus simple pour ne rien rater c'est ma lettre du vendredi. Et si tu as une question ou un doute : réponds-moi, je lis tout.

Recevoir la newsletter → Lire d'autres articles