Printemps 2026 · Mai · Critique 11 min de calme

Ces agences IA qui vendent du Zapier déguisé en IA

12% des multi-agent systems passent leur revue opérationnelle. Distinguer agence IA technique et workflow no-code repeint en agent IA.

Par Antoine Reverdy

Publié le 19 mai 2026

Rangée de masques vénitiens colorés sur fond noir, vus de profil. — Photo : Habib Beaini sur Unsplash

Note de transparence : ce journal est édité par ARCKONE, agence IA active sur ce marché. Voir mentions légales.

Le boom des « agents IA » sur le marché agence en 2026

Le mot « agent IA » est sur tous les sites d’agence depuis un an. Gartner annonce que 40% des applications d’entreprise embarqueront des agents IA spécifiques fin 2026, contre moins de 5% début 2025. Le chiffre est spectaculaire et il a déclenché une course commerciale prévisible : tout le monde se met à vendre des agents.

Le problème, c’est que le mot « agent » est devenu un raccourci marketing. On le trouve dans des devis qui décrivent en réalité un automation Zapier classique, parfois enrichie d’un appel API à GPT-4 quelque part au milieu du pipeline. Et facturé en conséquence.

Cet article n’est pas un règlement de comptes. C’est une grille de lecture pour acheteur lucide. Il a une jumelle, Les agences IA françaises qui méritent qu’on en parle, qui se concentre sur les acteurs sérieux. Ici, on travaille la grammaire. Comment distinguer un agent IA d’un Zap repeint. Et pourquoi cette distinction n’a rien d’académique : elle a des conséquences directes sur le coût, la fiabilité, la maintenabilité de ce que vous achetez.

La grammaire technique : ce qu’est vraiment un agent IA

Anthropic, qui édite Claude, a publié fin 2024 un texte de référence intitulé Building Effective Agents. La distinction y est posée sèchement.

Workflow : système où les LLM et les outils sont orchestrés à travers des chemins de code prédéfinis.

Agent : système où le LLM dirige dynamiquement ses propres processus et son usage d’outils, en gardant le contrôle de la manière dont il accomplit la tâche.

Cette définition n’est pas un point de vue. C’est devenu le consensus de l’industrie. OpenAI dit la même chose dans la documentation de son Agents SDK : un agent est un LLM équipé d’instructions et d’outils, qui décide seul des prochaines étapes en se basant sur le raisonnement du modèle. LangChain, avec LangGraph, parle d’un framework d’orchestration bas niveau pour des agents « long-running et stateful », c’est-à-dire qui durent et qui maintiennent un état.

Quatre briques techniques caractérisent un vrai agent en 2026.

Un LLM avec capacité de reasoning. Un modèle qui ne se contente pas de générer du texte, mais qui choisit, à chaque tour, l’action suivante en fonction de ce qui s’est passé avant.

Des outils branchés au LLM. Des fonctions exposées au modèle avec un schéma typé. Le LLM décide quand et comment les appeler. Pas l’humain qui a écrit le workflow.

Un état persistant. Mémoire courte (contexte de tâche, historique d’exécution) et mémoire longue (vector stores, knowledge bases). Sans état, pas d’agent : juste une suite d’appels sans cohérence.

Une boucle de contrôle. L’agent observe le résultat de chaque action, re-raisonne, ajuste. Il s’arrête quand la tâche est faite, pas après N étapes codées en dur.

Les frameworks de référence en 2026 sont LangGraph (orchestration stateful, checkpointing, human-in-the-loop), CrewAI (agents collaboratifs avec rôles, tâches, mémoire), l’OpenAI Agents SDK (agents avec handoffs et guardrails) et quelques alternatives comme AutoGen. Une agence sérieuse en cite au moins un quand on lui demande sur quoi elle construit.

La grammaire commerciale : ce que beaucoup d’agences appellent agent IA

Voici ce qu’on retrouve souvent dans les devis facturés « agent IA » à quinze, vingt ou trente mille euros pour une PME.

Un trigger Zapier sur un événement (nouveau lead dans le CRM, nouveau mail dans la boîte support, nouvelle ligne dans Airtable).

Une chaîne de steps dans Zapier, Make ou n8n. Chaque step est un appel d’API conditionnel : si telle valeur, alors telle branche.

Un step au milieu qui appelle l’API d’OpenAI ou d’Anthropic avec un prompt fixe. Le modèle reçoit des données, génère un texte, le pipeline continue.

Une sortie : un email, un Slack, une fiche CRM mise à jour, un PDF généré.

Techniquement, c’est un workflow conditionnel avec un appel LLM intercalé. Anthropic l’appelle un prompt chaining, premier des six patterns décrits dans Building Effective Agents, et le plus basique. Ce n’est pas un agent. Il n’y a pas de boucle de reasoning. Le LLM ne décide rien : il remplit un champ. Le chemin est rigide, codé en dur dans l’interface no-code. Si la donnée d’entrée ne ressemble pas à ce qui était prévu, le workflow casse ou produit n’importe quoi.

Ce qui pose problème, ce n’est pas l’outil. Zapier, Make et n8n sont d’excellents outils pour ce qu’ils font. Zapier eux-mêmes ont depuis lancé une vraie offre Agents, distincte des Zaps classiques, justement parce qu’ils savent que c’est deux catégories différentes. Le problème, c’est l’étiquette. Vendre un workflow Zapier au prix et sous le nom d’un système agentique, c’est de la confusion sémantique facturée au client.

Pourquoi la différence compte

Trois raisons concrètes.

La fiabilité opérationnelle. Une enquête VentureBeat publiée début 2026 a sondé 200 responsables IT en charge de déploiements multi-agents. Seuls 12% de ces systèmes ont passé une revue opérationnelle complète. Autrement dit, 88% des systèmes vendus comme multi-agents en production ne sont pas réellement audités, monitorés, gouvernés. Quand l’agence vous vend de l’agentique, demandez-lui qui passe la revue opérationnelle, et avec quels critères. Si la réponse est vague, vous êtes du côté des 88%.

Le coût d’exécution. Les architectures multi-agents consomment, selon les mesures de Nite Agent sur leurs déploiements 2026, environ 15 fois plus de tokens qu’une simple conversation LLM. Un workflow Zapier avec un appel GPT, ça coûte quelques centimes par exécution. Un vrai agent qui raisonne en boucle, c’est dix à cent fois plus, parfois davantage si le modèle utilisé est Claude Opus ou GPT-5. Si vous payez le prix d’un agent mais que l’agence vous facture la consommation API d’un Zap, c’est qu’il n’y a pas d’agent. Inversement, si la facture API explose mystérieusement, c’est qu’il y a peut-être un agent réel, et il faut l’auditer.

Le déterminisme. Un workflow est déterministe : mêmes entrées, mêmes sorties. Un agent est non-déterministe : il choisit son chemin. C’est une force pour des tâches floues (synthèse, recherche, classification ouverte) mais une faiblesse pour des tâches qui doivent être reproductibles (facturation, calcul réglementaire, génération de documents légaux). Vendre un agent là où il faudrait un workflow, c’est introduire de la variance dans un endroit où elle n’a rien à faire. L’inverse, vendre un workflow là où il faut un agent, c’est promettre de l’adaptabilité qu’on n’a pas.

Cinq questions techniques à poser en évaluation fournisseur

À utiliser tels quels, sans excuse, en réunion commerciale ou par mail avant signature.

1. Sur quel framework agent construisez-vous ?

Réponses crédibles : LangGraph, CrewAI, OpenAI Agents SDK, AutoGen, développement custom Python avec gestion d’état explicite. Réponses qui ne sont pas crédibles pour de l’agentique : « Zapier », « Make », « n8n » seuls, « notre plateforme propriétaire low-code » sans détail technique.

2. Comment gérez-vous l’état de l’agent entre les étapes ?

Réponses crédibles : checkpointing (LangGraph), sessions persistantes (OpenAI Agents SDK), vector store branché, base de données dédiée. Réponse qui doit alerter : « on stocke dans Airtable » comme seule réponse. Si l’état tient dans une table, c’est probablement un workflow, pas un agent.

3. Comment le LLM décide-t-il quelle action exécuter ensuite ?

Réponses crédibles : tool calling natif du modèle, ReAct loop, structured output qui pilote le routing. Réponse qui doit alerter : « le LLM remplit un champ et après le workflow continue selon des conditions no-code ». C’est du prompt chaining, pas un agent.

4. Quels guardrails et quels tests de non-régression avez-vous ?

Un vrai système agentique en production a des guardrails (validation des entrées et sorties, parfois en parallèle de l’agent), un système d’évaluation des sorties, un suivi des drifts de performance. Si la réponse est « on teste à la main avant livraison », ce n’est pas production-ready au sens où l’entendent Anthropic, OpenAI ou les frameworks LangChain.

5. Quelle est la consommation moyenne en tokens et le coût API par exécution ?

Une agence qui maîtrise son agent connaît ce chiffre. Pas exactement, mais en ordre de grandeur. Si on vous répond « c’est inclus dans le forfait sans détail », demandez à voir les logs de consommation OpenAI ou Anthropic. Si on refuse, vous savez ce que vous achetez.

Cas où le no-code workflow est en fait le bon choix

Il faut être net : tout n’est pas à mettre dans un agent. Anthropic le dit elle-même dans Building Effective Agents : utilisez un agent seulement quand vous ne pouvez pas prédire le nombre d’étapes nécessaires ou quand vous ne pouvez pas pré-coder le chemin. Sinon, un simple appel LLM optimisé avec retrieval suffit.

Cas typiques où un workflow no-code avec appel LLM est le bon choix :

Résumé périodique d’un flux de données (synthèse hebdo des leads, digest des tickets support, rapport d’activité automatique).
Classification d’entrée sur un nombre fini de catégories connues (router un mail vers la bonne équipe, prioriser un lead).
Génération de contenu à structure stable (réponse type, message de bienvenue personnalisé, rappel de paiement).
Extraction d’information d’un document à format prévisible (parsing d’une facture, d’un CV, d’un contrat type).

Pour ces cas, un Zap, un Make ou un n8n avec un step LLM bien prompté fait le travail. Ça coûte cent fois moins cher qu’un agent custom et c’est plus fiable. Une agence honnête vous le dit. Une agence opportuniste vous vend un agent.

Cas où il faut un vrai système agentique :

Recherche autonome sur un sujet ouvert (veille concurrentielle qui explore et décide quoi creuser).
Résolution de tickets support complexes où la suite des actions dépend de ce que le client répond et des outils consultés.
Assistants métier qui combinent plusieurs systèmes (CRM, ERP, documentation interne) avec un raisonnement long.
Investigation, audit, debug qui demandent d’enchaîner outils et hypothèses sans chemin prédéfini.

La frontière n’est pas mystérieuse : si vous pouvez écrire le flowchart complet sur une feuille A4, c’est un workflow. Si le flowchart dépend d’observations en cours d’exécution et ne tient pas sur la feuille, c’est un terrain d’agent.

Grille de lecture du devis avant signature

Six points à passer en revue, dans l’ordre.

Le vocabulaire. Le devis utilise-t-il « agent IA » comme bullet marketing ou comme description technique ? Si le mot apparaît une fois en titre et plus jamais dans le détail technique, alerte.

La stack annoncée. Quelle stack technique est nommée ? Un devis crédible nomme au moins un framework agent (LangGraph, CrewAI, OpenAI Agents SDK), un modèle (Claude Sonnet 4.5, GPT-5, Mistral Large), une infrastructure (Cloudflare Workers AI, AWS Bedrock, hébergement custom). Pas nommer, c’est masquer.

La gouvernance. Le devis prévoit-il monitoring, observabilité, guardrails, gestion des coûts API ? Si oui, c’est sérieux. Si la livraison s’arrête à « mise en production », l’agence vous laisse seul avec un système qu’elle ne sait pas opérer.

La part de no-code. Quel pourcentage du système est en Zapier / Make / n8n et quel pourcentage est en code custom ? Pas un jugement de valeur : une question de transparence. Un système 100% Zapier vendu comme custom agent est un mensonge. Un système 80% Zapier honnêtement présenté comme automation no-code avec touche IA est une bonne affaire, si le prix correspond.

Les coûts récurrents. Les coûts API sont-ils chiffrés ou « à voir selon usage » ? Un fournisseur qui ne sait pas estimer la consommation ne maîtrise pas son architecture.

Les références client comparables. L’agence cite-t-elle des déploiements similaires en taille et en complexité ? Pas des logos, des cas. Sans cas concret, on est dans la promesse.

La grille tient en une question

Au fond, tout se résume à une seule chose : le LLM décide-t-il, ou remplit-il un champ ?

Si le LLM décide (quel outil appeler, quand s’arrêter, dans quel ordre explorer), c’est un agent, et ça vaut le prix d’un agent.

Si le LLM remplit un champ entre deux conditions no-code, c’est un workflow avec appel LLM, et ça vaut le prix d’un Zapier prémium plus une journée de prompt engineering.

Le marché 2026 vend trop souvent le second au prix du premier. La grille ci-dessus n’empêche pas le mensonge. Elle le rend coûteux à porter.

Questions fréquentes

Un workflow Zapier avec un appel GPT, ça reste utile ?

Oui, et c'est même souvent le bon choix. Le problème n'est pas l'outil, c'est l'étiquette. Un Zap qui envoie un email résumé par GPT chaque matin résout un vrai problème, à coût marginal. Le payer 25 000 euros parce que le devis dit agent IA, c'est ça l'arnaque.

Comment savoir si l'agence me vend un vrai agent IA ou un workflow déguisé ?

Demandez le framework utilisé. Si la réponse est Zapier, Make ou n8n seuls, ce n'est pas un agent au sens technique. Si la réponse mentionne LangGraph, CrewAI, AutoGen, OpenAI Agents SDK ou un développement custom avec état persistant et boucle de reasoning, c'est crédible. Demandez ensuite à voir le graphe d'état.

Pourquoi 12% seulement des systèmes multi-agents passent la revue opérationnelle ?

Parce que mettre en production un système où plusieurs LLM se parlent demande de la gouvernance, du monitoring fin, de la maîtrise des coûts, de la gestion des cascades d'erreurs. La plupart des projets restent au stade démo, où ils marchent en conditions parfaites mais cassent dès qu'on branche les vrais cas limites.

Le hype agent IA va-t-il durer ?

Le terme va se banaliser, comme cloud ou digital avant lui. Ce qui restera : la capacité à brancher un LLM sur des outils, à lui donner un état durable, à le laisser planifier en boucle. Le reste, ce sont des Zaps. Ce qui disparaîtra : les agences qui vendent l'étiquette sans la substance.

Sources

Analyse Gartner Predicts 40% of Enterprise Apps Will Feature Task-Specific AI Agents by 2026 Gartner · vérifié le 19 mai 2026
Source primaire Building Effective Agents Anthropic · vérifié le 19 mai 2026
Source primaire LangGraph - Low-level orchestration framework for stateful agents LangChain · vérifié le 19 mai 2026
Source primaire CrewAI - Build collaborative AI agents and crews CrewAI · vérifié le 19 mai 2026
Source primaire What is an AI agent? Zapier · vérifié le 19 mai 2026
Analyse Multi-Agent System Architecture ClickIT · vérifié le 19 mai 2026
Presse Enterprise agentic AI requires a process layer most companies haven't built VentureBeat · vérifié le 19 mai 2026
Analyse Multi-Agent Systems in Production 2026 - Three Patterns That Survived Nite Agent · vérifié le 19 mai 2026

Antoine Reverdy couvre les acteurs du marché et les signaux faibles des agences IA.

Désaccord, retour, erreur factuelle ? Droit de réponse garanti.