Architecture3 min de lecture

Votre base de connaissances est votre vrai produit IA

Andrej Karpathy a formulé une analogie qui change tout : le LLM est un compilateur, votre base de connaissances est le code source. Si le code source est mauvais, peu importe la qualité du compilateur.

Partager

Andrej Karpathy - ancien directeur de l'IA chez Tesla, co-fondateur d'OpenAI - a formulé une analogie que je n'avais pas vue venir : le LLM est un compilateur. Votre base de connaissances est le code source.

J'ai lu ça en 2025 et quelque chose a changé dans ma façon de construire les systèmes. Pas la façon dont je choisis les modèles. La façon dont je prépare ce que je leur donne à lire.

Quand vous compilez du mauvais code, peu importe la qualité du compilateur - l'output sera mauvais. Même logique avec les agents : si votre contexte est pauvre ou désorganisé, le modèle le plus puissant du monde ne peut rien faire de valable avec.

L'erreur que j'ai faite au début

Mes premiers agents chez Albus Factory étaient mauvais. Pas parce que j'avais choisi le mauvais modèle. Parce que je leur avais donné des contextes vagues, génériques, sans structure réelle.

J'ai passé des semaines à optimiser les prompts. Le problème n'était pas là. Le problème était en amont : ce que les agents étaient censés savoir n'était pas formalisé. Ils improvisaient. Et l'improvisation à grande échelle, ça produit de l'incohérence.

La plupart des entreprises font la même erreur. 80% du temps sur le choix du modèle, l'optimisation des prompts, les outils. 5% sur la structuration de ce que l'agent doit savoir. C'est l'inverse qu'il faut faire.

Ce qu'une vraie base de connaissances contient

Chez Albus Factory, la mémoire d'entreprise est formalisée en fichiers .md organisés par domaine :

  • Processus : comment les tâches se font, étape par étape, avec les cas limites documentés

  • Offres : les produits, leurs arguments, leurs objections habituelles

  • Personas : qui sont les clients, leurs problèmes, leur vocabulaire

  • Historiques : ce qui a marché, ce qui a échoué, pourquoi

  • Règles : ce que les agents ne doivent jamais faire, les lignes rouges

Ce travail représente 60% du temps sur un projet IA. Pas le code. Pas les prompts. La connaissance. C'est là que se joue l'essentiel.

Les lessons.md : la mémoire qui s'améliore seule

Ce qui différencie un système vivant d'un projet mort : chaque agent écrit ses propres lessons après chaque run, et les relit au run suivant. La base s'améliore automatiquement, sans intervention humaine.

En 4 mois chez Albus, 13 fichiers de lessons accumulés. Des centaines d'erreurs évitées, de patterns validés, de corrections propagées automatiquement à travers tout le système. Je n'ai pas eu à intervenir manuellement une seule fois.

La vraie question à poser

Pas : quel modèle choisir ? Pas : comment rédiger le bon prompt ?

Mais : quelle connaissance métier dois-je formaliser, structurer et rendre accessible à un système autonome pour qu'il soit réellement utile ?

La réponse à cette question est votre vrai produit IA. Tout le reste est de l'assemblage.

Partager