Tag · 6 entrées
#tooling
Toutes les entrées du jardin étiquetées tooling, du plus récent au plus ancien.
Tag · 6 entrées
Toutes les entrées du jardin étiquetées tooling, du plus récent au plus ancien.
Pendant des semaines, j'ai laissé des agents Claude coder ma plateforme la nuit sans jamais savoir ce qu'ils me coûtaient. Alors j'ai posé un compteur sur chaque run. Il m'a montré trois choses gênantes : presque la moitié des cycles tournaient à vide, un ticket s'est fait relancer cent soixante-seize fois, et j'envoyais mon modèle le plus cher trier des broutilles. Récit d'une mise à la diète, sans rogner sur la qualité.
Un programme autonome qui se trompe ne se trompe pas une fois, il se trompe en boucle, toute la nuit. Récit des garde-fous que j'ai posés sur Forge pour qu'il borne ses emballements, reprenne ses agents morts, range ses propres carcasses et m'alerte avant le matin, le tout sans moi. Avec, en dernier recours, un agent dont le seul travail est de réparer la machine à agents.
Dans la fiche du projet, je laissais rikiki en 0.2.0 avec une liste de promesses : des vraies transitions, une vue d'ensemble qui se cherche, la navigation à la souris. Trois semaines et trois versions plus tard, la liste a fondu. Voici le journal de bord, du morph Magic Move au présentateur fantôme qui a fallu rattraper une deuxième fois.
Sur Granit Golem, le vrai coût n'était pas les bugs. C'était d'attendre vingt minutes de CI pour apprendre une broutille. Alors j'ai appris à l'agent à rater tôt : un LSP, puis une cascade de hooks, des oracles déterministes qui signalent l'erreur à la seconde où elle naît.
Retour sur la conception du scheduler qui orchestre mes agents. Un ordonnanceur qui arbitre plusieurs natures de tâches doit modéliser l'état de chacune explicitement, sinon cet état se reconstitue partout, de façon divergente. Le jour où je ne l'avais pas fait, j'ai corrigé cinq fois le même défaut avant de comprendre qu'il s'agissait d'une machine à états manquante.
Au départ, une commande lancée à la main pour faire coder un ticket par un agent. Six semaines plus tard, un programme qui pioche dans ma backlog GitLab jour et nuit. Récit d'une dérive vers l'autonomie : une mouture qui coince encore, et que le passage de Claude à la facturation au token rendra bientôt coûteuse.