Le LLM Wiki,
ton deuxième
cerveau.
Karpathy a partagé en 2026 un pattern (un schéma de conception réutilisable) simple mais puissant : au lieu d'un RAG classique (Retrieval Augmented Generation, en clair : l'IA va chercher la réponse dans tes documents à chaque question), l'IA construit et maintient un vrai wiki qui s'enrichit à chaque nouvelle source. Un vrai deuxième cerveau, qui se compile et s'affine. Je t'explique le concept et comment te le monter.
Ce que tu vas apprendre
- Pourquoi le RAG ne suffit pas — l'IA "redécouvre" ta connaissance à chaque requête, rien ne s'accumule
- Le pattern LLM Wiki — 3 couches (raw sources = sources brutes / wiki / schema = règles de structure), 3 opérations (ingest = ajouter une source / query = poser une question / lint = nettoyer)
- 5 cas d'usage concrets : personnel, recherche, lecture de livre, business, analyse concurrentielle
Tu débutes complet en IA ?
Si certains termes te perdent (Claude Code, terminal, agent, MCP, skill…), commence d'abord par le guide débutant et garde le lexique ouvert dans un autre onglet. Tu reviendras ici avec les bases.
Statut de cet article — première version
C'est un explainer + guide de démarrage du pattern. Je lance mon propre wiki ce mois-ci et je publierai un retour d'expérience chiffré en mai 2026 (mesures réelles : ingest, query, lint, coût total, captures Obsidian, pièges concrets). En attendant, le contenu ici est conceptuel et issu du gist Karpathy + 4 mois de tests dispersés sur Claude Projects et NotebookLM. Écris-moi si tu veux que je te ping quand le retour d'XP sort.
À partir de quand ça vaut vraiment le coup.
Sois franc avec toi-même : ce pattern n'est pas pour tout le monde. Voici mon seuil personnel, en fonction du volume de sources que tu comptes accumuler.
Moins de 10 sources · Non
C'est disproportionné. Utilise les Projects dans Claude.ai (la fonctionnalité « Projets » de Claude qui regroupe docs + instructions partagées) — tu téléverses tes 5-10 documents, tu converses, c'est réglé en 2 minutes. Pas besoin de schema, pas besoin d'Obsidian (une appli de prise de notes en markdown très utilisée), pas besoin de Claude Code. Pas besoin de monter une machinerie complexe.
10 à 50 sources · Oui si tu requêtes chaque semaine
Le bon équilibre arrive quand tu reviens régulièrement dessus. Veille IA, R&D produit, analyse concurrentielle, revue de presse d'un secteur. Si tu ouvres le wiki 1×/semaine minimum, ça vaut la mise en place. Sinon, encore trop tôt.
50 sources et plus · Oui clairement
À ce volume, tu ne retrouves plus ce que tu as accumulé sans wiki. Tu relis 3 fois les mêmes articles. Tu oublies les connexions que tu avais faites. Le wiki devient ton seul moyen de capitaliser. Au-delà de 100 sources, c'est non-négociable.
LLM Wiki vs les alternatives — lequel choisir ?
Le LLM Wiki n'est pas le seul outil qui gère une base de connaissances personnelle avec une IA. Voici la comparaison honnête pour t'aider à trancher.
| Outil | Volume utile | Compétence | Accumule ? | Pour qui |
|---|---|---|---|---|
| Claude Projects | ~50 documents | Zéro (web) | Non — retrieval à chaque question | Non-dev, usage ponctuel, tu démarres |
| NotebookLM | Jusqu'à 300 sources | Zéro (web) | Non | Étude, recherche d'un sujet précis, gratuit |
| Notion AI + agents | Illimité | Faible (no-code) | Partiel | Équipe déjà sur Notion |
| LLM Wiki (Karpathy) | 100 à 500 pages | Claude Code basique | Oui, explicitement | Curieux patient, sujet unique qui grossit |
| GraphRAG (Microsoft) | 10 000+ documents | Dev Python sérieux | Oui (graphe d'entités — chaque concept devient un nœud relié aux autres) | Équipe tech, très gros corpus |
Tu n'es pas à l'aise avec la ligne de commande ?
Commence par Claude Projects ou NotebookLM. Tu auras 80% des bénéfices d'un LLM Wiki sans toucher à Claude Code. Une logique proche existe aussi dans Cursor côté code. Quand tu butes sur la limite (volume, accumulation, maintenance), tu migres vers le vrai pattern Karpathy. Pas l'inverse.
Pourquoi le RAG ne suffit pas.
Tu connais le fonctionnement classique : tu uploades tes documents dans NotebookLM / ChatGPT / n'importe quel RAG. Tu poses une question. L'IA cherche les extraits pertinents, te répond. Ça marche.
Mais il y a un problème fondamental que Karpathy pointe : rien ne s'accumule. L'IA recommence de zéro à chaque question. Si tu lui poses une question subtile qui nécessite de synthétiser 5 docs, elle doit les retrouver et les recoller à chaque fois. Aucune trace de ce que tu as déjà découvert. Aucune synthèse qui s'améliore. Aucune connexion qui se construit.
Retrieve à chaque fois
L'IA part des documents bruts à chaque question. Elle recrée la synthèse depuis zéro. Rien ne s'affine. Tu dépends 100% de la qualité de la recherche du moment.
Accumulation compilée
L'IA construit un wiki persistant qui s'enrichit à chaque source. Les connexions sont déjà faites. Les contradictions sont déjà notées. La synthèse est déjà prête.
La métaphore qui clique
Un RAG classique, c'est comme si tu avais un bibliothécaire qui ne connaît pas les livres, les lit uniquement quand tu poses une question, puis les oublie. Un LLM Wiki, c'est un bibliothécaire qui a lu chaque livre, a pris des notes, fait des fiches, relié les concepts entre eux. Quand tu lui poses une question, il répond depuis sa propre compréhension déjà construite.
Nuance importante : les RAG modernes (GraphRAG de Microsoft, Mem0, Zep) font aussi de l'accumulation. La vraie différence du LLM Wiki, c'est que l'accumulation est explicite et lisible par un humain (du markdown — un format texte lisible avec quelques marqueurs simples — que tu peux ouvrir dans Obsidian), alors que les RAG modernes stockent tout dans des embeddings vectoriels (des représentations mathématiques du sens, illisibles à l'œil) opaques.
Les 3 couches.
Le système repose sur une séparation claire entre ce qui est fixe, ce que l'IA écrit, et ce qui la guide.
Tes documents d'origine : articles, papers, transcripts, captures, PDFs. L'IA les lit mais ne les modifie jamais. C'est ta source de vérité. Tu curates cette couche toi-même.
Un dossier de fichiers markdown que l'IA possède entièrement. Pages d'entités, pages concepts, comparatifs, index, synthèses. Elle crée, met à jour, maintient les cross-références. Toi tu lis, elle écrit.
Un fichier type CLAUDE.md ou AGENTS.md qui définit comment le wiki est organisé, les conventions, les workflows (les enchaînements d'étapes à suivre). C'est ce qui transforme ton LLM d'un chatbot générique en mainteneur discipliné du wiki. Tu l'ajustes avec le temps.
La combinaison recommandée par Karpathy
L'IA d'un côté, Obsidian de l'autre. L'IA fait les modifs via conversation, tu regardes les résultats dans Obsidian en temps réel (follow links, graph view — la vue graphique qui relie tes notes entre elles, pages mises à jour). Analogie : "Obsidian est l'IDE (l'éditeur de code, ici de notes), le LLM est le programmeur, le wiki est le codebase (l'ensemble du contenu)".
Les 3 opérations.
Trois actions à maîtriser — tout le reste en découle.
Ingest · Tu ajoutes une source
Tu déposes un article, une publication, une transcription. Tu dis à l'IA : "traite cette source". Elle :
- Lit le document
- Discute avec toi des points clés
- Écrit une page de résumé dans le wiki
- Met à jour l'index
- Met à jour les pages d'entités et concepts pertinentes dans tout le wiki
- Ajoute une entrée au log
Une seule source peut toucher 10-15 pages du wiki. C'est ça le compound effect (en clair : l'effet boule de neige — chaque ajout enrichit tout le reste).
Query · Tu poses une question
L'IA cherche dans le wiki (pas les documents bruts — le wiki), lit les pages pertinentes, synthétise une réponse avec citations. La réponse peut prendre plusieurs formes : markdown, tableau comparatif, slide deck, graphique.
Le détail clé : une bonne réponse peut être intégrée au wiki comme nouvelle page. Une comparaison intéressante, une analyse, une connexion que tu as trouvée — ça ne disparaît plus dans l'historique de conversation. Ça devient un actif permanent.
Lint · Tu maintiens la qualité (mensuellement)
C'est l'opération que beaucoup d'articles dérivés oublient — pourtant Karpathy y insiste. Tu demandes à l'IA de vérifier la santé du wiki : liens cassés, doublons, contradictions entre pages, entités mal nommées, incohérences de style.
Sans cette passe, le wiki dérive en silence. Avec elle, il reste propre même à 100 ou 200 pages. Une fois par mois suffit si tu ingestes ~1 source par jour.
Les 3 pièges qu'on ne te dit pas assez
- Dérive épistémique — si l'IA hallucine (terme technique : génère du contenu plausible mais faux) au moment de l'ingestion (un nom mal orthographié, une date fausse, un résumé inexact), l'erreur devient permanente et contamine tous les ingests suivants. Relis toujours la page de résumé juste après la création.
- Duplication silencieuse — 3 sources sur le même sujet créent souvent 3 pages presque identiques. Sans règle explicite de merge (fusion) dans ton schema, tu te retrouves vite avec un wiki pollué. La passe de lint mensuelle est là pour ça.
- Coût tokens réel — un ingest touche 5 à 15 pages = 20 000 à 50 000 tokens en sortie. À 15$ le million de tokens (Claude Sonnet), compte 0,5 à 1$ par source. 100 sources = 50 à 100$. Pas catastrophique, mais à savoir avant de foncer.
5 cas d'usage concrets.
1. Personnel · Track ta vie
Journal, articles que tu as aimés, podcasts écoutés, progression santé, objectifs. L'IA archive chaque entrée et construit une image structurée de qui tu es et où tu vas. Dans 2 ans tu peux demander "qu'est-ce qui a le plus changé dans ma vision du travail ?" et avoir une vraie réponse.
2. Recherche · Creuser un sujet à fond
Tu veux maîtriser un domaine (IA, Europe fiscale, physique quantique). Tu ajoutes 50 articles de recherche, 30 articles de presse, 10 podcasts sur plusieurs semaines. Ton wiki devient une référence exhaustive et personnelle sur le sujet. Ta thèse évolue avec chaque source.
3. Lecture d'un livre · Fan wiki personnel
Tu lis Seigneur des Anneaux. À chaque chapitre, tu ajoutes le texte. L'IA construit des pages pour les personnages, les lieux, les événements, les thèmes. À la fin, tu as ton propre Tolkien Gateway — riche, interconnecté, personnel.
4. Business/team · Wiki vivant
Un wiki interne alimenté par vos Slack, transcripts de réunions, docs produits, appels clients. L'IA maintient, les humains valident. Le wiki reste à jour parce que personne n'a à le maintenir manuellement.
5. Veille concurrentielle / Due diligence
Tu pitches des investisseurs. Tu veux connaître tes concurrents. Ingests leurs sites, articles, interviews de fondateurs. Ton wiki devient une arme d'intelligence compétitive.
6. Wiki client agence · Le cas le plus parlant
Exemple Julie, agence com 5 personnes. Chaque client = 1 dossier. Dedans tu mets : briefs, comptes-rendus, transcripts Zoom, moodboards, livrables passés. Quand un client t'appelle 6 mois plus tard pour une relance, tu demandes à Claude Code "résume-moi où on en était avec [client]" → il te sort un brief en 20 secondes, sans relire 40 documents. C'est ce qui transforme tes réunions en "je suis préparé" au lieu de "je ne me souviens plus exactement".
Setup minimal.
C'est un pattern, pas un outil. Pas de pip install. Tu le construis en collaboration avec ton agent IA. Voici la recette minimale :
Crée ton dossier projet
mkdir mon-wiki cd mon-wiki mkdir sources wiki
sources/ = tes raw docs. wiki/ = ce que l'IA va maintenir.
Crée le schema (CLAUDE.md)
Un fichier qui dit à l'IA comment travailler. Exemple minimal :
# Wiki Schema Tu es le mainteneur d'un wiki personnel sur [SUJET]. ## Structure - wiki/index.md — vue d'ensemble - wiki/entities/ — personnes, entreprises, outils - wiki/concepts/ — idées, frameworks - wiki/summaries/ — résumés des sources ## Workflow ingest 1. Lis la source 2. Discute-en avec moi 3. Crée un résumé dans wiki/summaries/ 4. Update les entities/concepts touchés 5. Update l'index
Lance Claude Code dans le dossier
claude
Dis : "Lis CLAUDE.md. Je vais te donner ma première source, traite-la selon le workflow.". Dépose ton premier document. L'IA commence à construire ton wiki.
Installe Obsidian (optionnel mais recommandé)
Ouvre wiki/ comme vault Obsidian (un vault = un coffre, c'est-à-dire un dossier de notes qu'Obsidian sait afficher). Tu peux naviguer dans ton deuxième cerveau en temps réel : graph view, links, recherche.
À quoi ressemble ton wiki quand il tourne
Claude Code t'affiche les fichiers qu'il lit (wiki/sujets/ia-entreprise.md), les contradictions qu'il détecte (il crée un fichier contradictions.md s'il en trouve), les nouveaux sujets qu'il propose. Tu valides ou tu dis "non, pas ce sujet" — il apprend tes critères dans le schema. À chaque ingest, tu vois défiler en clair : "j'ai lu ta source, j'ai créé summaries/2026-04-podcast-hormozi.md, j'ai mis à jour entities/hormozi.md et concepts/offer-stack.md, j'ai ajouté 1 entrée au log". Rien de magique, tout est traçable.
Le piège à éviter
Ne cherche pas à automatiser tout dès le début. Karpathy insiste : reste impliqué au départ. Lis les résumés de l'IA, corrige-la, guide-la sur ce qui compte. Elle apprend ton style. Ton schema évolue. Plus tard tu pourras batcher. D'abord tu cadres.
Pourquoi c'est au-dessus d'un RAG.
Après quelques semaines d'usage, voici ce que tu constates :
- Tes questions deviennent plus subtiles — tu peux demander "où mes sources se contredisent ?" et obtenir une vraie réponse
- Les connexions émergent — l'IA t'indique quand une nouvelle source est en tension avec ce que tu avais noté avant
- Tu accumules — tu n'as plus peur de "perdre" une découverte, tout est archivé
- Tu peux partager — un wiki est un artefact concret, pas une conversation ChatGPT éphémère
- Tu te connais mieux — en relisant les synthèses de l'IA sur toi, tu vois les patterns que tu ne voyais pas
Mon plan personnel
Je lance mon premier LLM Wiki ce mois-ci sur "IA appliquée au business". Objectif : en 3 mois, avoir le wiki le plus complet que je pourrai consulter ou partager. Je ferai un tuto dédié avec mon setup précis — inscris-toi à la newsletter si tu veux suivre.
Pour creuser directement.
- Le gist original de Karpathy — 3 pages, tout est là
- Obsidian — Pour explorer ton wiki en graph view
- GraphRAG (Microsoft) — l'alternative RAG moderne pour très gros corpus
- Cursor — la même logique IDE + LLM côté code
- Mon article Les travaux de Karpathy, vulgarisés — contexte sur le personnage
- Mon article Les agents auto-améliorants — l'autre projet clé de Karpathy 2026
- Mon article Construire ta veille IA pour demain — pipeline pratique pour alimenter le wiki
FAQ LLM Wiki.
C'est quoi un LLM Wiki au sens de Karpathy ?
Un pattern partagé par Karpathy en 2026 : au lieu d'un RAG classique, l'IA construit et maintient un vrai wiki en markdown qui s'enrichit à chaque source. Un deuxième cerveau lisible (pas des embeddings opaques) où chaque ingest crée des résumés, met à jour les pages d'entités, tisse des liens. L'accumulation est explicite et auditable.
Quelle différence vs Notion AI ou Obsidian classique ?
Notion AI cherche dans tes pages mais ne les enrichit pas auto. Obsidian est un excellent éditeur markdown sans intelligence : c'est toi qui crées les pages et fais les liens. Le LLM Wiki combine les deux : Obsidian comme IDE (graph + édition) et le LLM comme programmeur qui ingest, met à jour, fait le lint. Différence clé vs un RAG : tu vois (et corriges) ce que l'IA a compris.
Combien ça coûte par mois ?
Compte 0,5 à 1 $ par source ingérée avec Sonnet (15 $/M tokens), soit 50-100 $ pour bâtir un wiki de 100 sources sur 30 jours. Ensuite, le coût décroît : tu n'ingères que les nouvelles sources, plus quelques opérations de lint et de query. Pour un usage perso à 5-10 sources/mois, compte 5-10 $/mois. Obsidian gratuit. Tu n'as besoin que de Claude Code (Pro à 20 €/mois ou API en pay-as-you-go).
Faut-il être développeur ?
Non. Si tu sais ouvrir un terminal, créer trois dossiers et copier-coller un schéma CLAUDE.md, tu peux monter un wiki. La difficulté n'est pas technique mais conceptuelle : définir le bon schema, rester impliqué au début pour cadrer le style, ne pas tout vouloir automatiser. Si tu n'es vraiment pas à l'aise avec le terminal, commence par Claude Projects ou NotebookLM : 80 % des bénéfices sans la machinerie.
Combien de temps avant la première valeur ?
Setup en 30 minutes (structure + schema + 5 sources ingérées). La première vraie valeur arrive entre 20 et 50 sources ingérées : c'est là que les connexions inattendues émergent lors des queries. En dessous de 10 sources, le wiki est disproportionné (Claude Projects fait aussi bien). Au-dessus de 50 sources, le compound effect de l'accumulation devient flagrant.
Différence avec Cursor ou Claude Projects ?
Cursor est un IDE pour coder qui utilise un LLM en temps réel sur ta codebase — proche dans l'esprit (IA + éditeur cohabitent), ciblé code. Claude Projects regroupe documents et instructions partagées sur claude.ai : 5-10 docs, conversation, parfait jusqu'à 20-30 sources mais rien ne s'accumule entre conversations. Le LLM Wiki conserve l'accumulation explicite en markdown sur ton disque, ce qui change tout passé 50 sources.
Le LLM Wiki remplace-t-il un RAG ?
Pour usage perso ou semi-pro : oui sur la plupart des cas. Pour bases multi-utilisateurs, multi-Go, en production avec contraintes de latence/gouvernance : non, les RAG modernes (GraphRAG Microsoft, Mem0, Zep) restent nécessaires. Vraie différence : l'accumulation du wiki est lisible (markdown), celle des RAG est dans des embeddings opaques. Wiki = transparence + maintenabilité, RAG = échelle.
Comment migrer Notion vers un LLM Wiki ?
Tu exportes tes pages Notion en markdown (export natif Notion → Markdown & CSV), tu les déposes dans le dossier sources/ du wiki, et tu lances l'opération ingest. L'IA génère les résumés, crée les pages d'entités et tisse les liens. Compte 1 à 2 jours pour 200 pages Notion. Garde Notion pour ce qui est collaboratif et bascule en wiki pour ta veille perso et KB métier — les deux peuvent coexister.
Quelle sécurité pour les données personnelles ?
Tes sources et le wiki vivent en local dans un dossier sur ton Mac. Les requêtes envoyées à Claude pour ingest/query/lint passent par l'API Anthropic, donc soumis aux mêmes garanties que Claude Pro (pas d'entraînement par défaut, ZDR en Enterprise). Pour des données vraiment sensibles (santé, juridique client, IP), envisage un modèle local via Ollama en backend du wiki — la mécanique pattern reste identique, seul change le moteur LLM.
Ça marche en plusieurs langues ?
Oui. Claude Sonnet est multilingual et gère sans souci ingest et query en français, anglais, allemand, espagnol, italien, etc. Bonne pratique : impose la langue de sortie dans le schema CLAUDE.md (par exemple toutes les pages d'entités en français même si les sources sont en anglais), pour éviter un wiki bilingue incohérent. Tu peux aussi avoir un wiki par langue si tu travailles sur des marchés distincts.
Tu repères une erreur ?
Une info obsolète, un chiffre qui a bougé, une source périmée ? Écris-moi à sagnier.jeremy@gmail.com · je corrige en 48h max et je note la date de MAJ en haut de l'article. Les retours terrain valent mille fois les articles — je lis tout, je réponds.
Prochains tutos en préparation.
Je prépare un tuto pas à pas sur mon propre LLM Wiki : quelle stack, quel schema, quelles premières sources. Inscris-toi pour ne pas manquer ça.
Voir les newsletters →