Tag · 6 entrées
#ia
Toutes les entrées du jardin étiquetées ia, du plus récent au plus ancien.
Tag · 6 entrées
Toutes les entrées du jardin étiquetées ia, du plus récent au plus ancien.
Pendant des semaines, j'ai laissé des agents Claude coder ma plateforme la nuit sans jamais savoir ce qu'ils me coûtaient. Alors j'ai posé un compteur sur chaque run. Il m'a montré trois choses gênantes : presque la moitié des cycles tournaient à vide, un ticket s'est fait relancer cent soixante-seize fois, et j'envoyais mon modèle le plus cher trier des broutilles. Récit d'une mise à la diète, sans rogner sur la qualité.
Les pages de monitoring de Granit mettaient parfois seize secondes à s'afficher. J'ai posé un BFF, un endpoint qui rassemble tout ce qu'une page réclame en une seule réponse. Le chiffre est tombé à quatre secondes et demie, puis s'est arrêté là. La lenteur n'avait pas disparu : elle avait juste changé de pièce, du navigateur vers la base. Récit d'une chasse, requête par requête, jusqu'au scan qui balayait toutes les partitions.
Un programme autonome qui se trompe ne se trompe pas une fois, il se trompe en boucle, toute la nuit. Récit des garde-fous que j'ai posés sur Forge pour qu'il borne ses emballements, reprenne ses agents morts, range ses propres carcasses et m'alerte avant le matin, le tout sans moi. Avec, en dernier recours, un agent dont le seul travail est de réparer la machine à agents.
Sur Granit Golem, le vrai coût n'était pas les bugs. C'était d'attendre vingt minutes de CI pour apprendre une broutille. Alors j'ai appris à l'agent à rater tôt : un LSP, puis une cascade de hooks, des oracles déterministes qui signalent l'erreur à la seconde où elle naît.
Retour sur la conception du scheduler qui orchestre mes agents. Un ordonnanceur qui arbitre plusieurs natures de tâches doit modéliser l'état de chacune explicitement, sinon cet état se reconstitue partout, de façon divergente. Le jour où je ne l'avais pas fait, j'ai corrigé cinq fois le même défaut avant de comprendre qu'il s'agissait d'une machine à états manquante.
Au départ, une commande lancée à la main pour faire coder un ticket par un agent. Six semaines plus tard, un programme qui pioche dans ma backlog GitLab jour et nuit. Récit d'une dérive vers l'autonomie : une mouture qui coince encore, et que le passage de Claude à la facturation au token rendra bientôt coûteuse.