Sessions courtes vs longues
Plus une session s'allonge, plus l'agent oublie le début et plus chaque tour coûte cher. Savoir quand découper et quand continuer est une compétence à part entière : le context rot, le coût qui grimpe avec l'historique, et comment passer l'état d'une session à l'autre via des artefacts durables.
Le context rot : pourquoi une longue session se dégrade
À chaque tour, l’historique de la session grossit : instructions, messages, résultats d’outils, fichiers lus. La fenêtre de contexte est une limite dure (par ex. 200k tokens). Quand l’historique s’en approche, les messages anciens sont tronqués — l’agent oublie ce qu’il a fait au début.
Point clé : Le context rot, c’est la dégradation de l’agent quand sa session devient trop longue : il perd le fil, se contredit, refait ce qui était déjà fait.
Attention : La qualité baisse avant d’atteindre la limite dure. Noyé dans un long historique, le signal pertinent est dilué et l’attention du modèle se disperse. Une session de 150k tokens raisonne souvent moins bien qu’une de 20k focalisée.
Le coût grimpe avec la longueur
La boucle agentique renvoie l’historique complet au modèle à chaque tour. Plus la session est longue, plus chaque nouveau tour traite de tokens — donc plus il est cher et lent. Une session qui traîne paie son passé encore et encore.
Point clé : Deux raisons convergent vers les sessions courtes : la qualité (éviter le context rot) et le coût (éviter de re-traiter un historique massif à chaque tour).
Quand découper, quand continuer
| Continuer la session | Démarrer une session fraîche |
|---|---|
| Le travail en cours dépend directement de ce qui vient d’être fait. | On passe à une tâche indépendante (autre bug, autre module). |
| Le contexte accumulé est encore pertinent et compact. | L’historique est devenu long et l’agent commence à dériver. |
| On itère sur un même fichier avec un fil clair. | La nouvelle tâche n’a pas besoin de l’historique précédent. |
Point clé : Règle simple : une tâche = une session. Enchaîner cinq sujets sans rapport dans une même session, c’est saturer le contexte de bruit qui dégrade tous les sujets suivants.
Passer l’état sans tout garder en mémoire
Découper soulève une question : comment l’agent retrouve-t-il le contexte utile dans la session suivante ? La réponse n’est pas « tout garder en mémoire conversationnelle », mais matérialiser l’état dans des artefacts durables.
- Instructions persistantes (CLAUDE.md) : les conventions sont relues à chaque session sans qu’on les répète.
- Artefacts : une spec écrite, des tests, un fichier de plan, un commit — l’état du travail est dans le dépôt, pas dans l’historique du chat.
- Budget de tours : pour un agent autonome, une limite de tours/tokens évite la session qui s’étire et pourrit.
Point clé : Une sous-tâche bien découpée repart d’un contexte frais plus les artefacts dont elle a besoin. C’est l’équivalent d’un bounded context qui communique par des contrats explicites plutôt que par un état partagé implicite : le handoff passe par des fichiers versionnés, pas par la mémoire du modèle.