Printemps 2026 · Avril · Économie 13 min de calme

Les coûts cachés d'un projet IA en PME : la facture après le devis

Du devis à 8 000 € à la facture réelle à 35 000 € : décomposer le vrai TCO d'un projet IA en PME, données et études à l'appui.

Par Élise Marchessou

Publié le 29 avril 2026

Bureau en bois avec calculatrice, classeurs, cahier ouvert et lunettes posées dans la lumière du matin. — Photo : Cht Gsml sur Unsplash

Note de transparence : ce journal est édité par ARCKONE, agence IA active sur ce marché. Voir mentions légales.

Le devis qu’on signe et la facture qu’on paye

Un dirigeant reçoit trois propositions. Toutes gravitent autour de 8 000 € pour « un assistant IA branché sur les commandes clients ». Il choisit la moins chère, signe, démarre. Neuf mois plus tard, il a payé 35 000 €, le système marche par éclats, l’usage stagne, et la maintenance n’est même pas encore commencée.

Cette histoire n’est pas anecdotique. Elle est mécanique. Le devis initial ne couvre presque jamais les vraies couches de coût d’un projet IA en PME, parce que ces couches sont soit invisibles au moment du pitch, soit volontairement minimisées pour gagner la signature. Le résultat est partout le même : 42% des entreprises abandonnent désormais la majorité de leurs initiatives IA, contre 17% un an plus tôt, selon S&P Global Market Intelligence sur un échantillon de 1 006 décideurs IT et métier. Gartner prédit qu’au moins 30% des projets d’IA générative seront abandonnés après le proof of concept fin 2025, en grande partie à cause de l’escalade des coûts et de la qualité de données insuffisante.

Cet article n’est pas un listicle de bonnes pratiques. C’est une décomposition économique du vrai coût total de possession d’un projet IA en PME. Quatre couches, presque jamais détaillées dans un devis, qui expliquent l’écart entre le chiffre affiché et la facture finale.

Pour qui veut le contexte amont de cette analyse, 80% des projets IA en PME sont déjà morts en 2026 pose le pourquoi macro. Cet article répond à la question budgétaire : combien ça coûte vraiment, et quelles lignes sont systématiquement absentes des propositions commerciales.

Couche 1 : la préparation des données, 30 à 60% du budget caché

C’est la couche la plus connue et pourtant la plus systématiquement sous-évaluée. Toutes les études sectorielles convergent : la préparation des données absorbe 60 à 80% du temps d’un projet IA, avant même que le moindre modèle soit entraîné ou que le moindre prompt soit testé. Les data scientists eux-mêmes déclarent passer environ 60% de leur temps sur le nettoyage et 19% sur la collecte, soit près de 80% sur la donnée plutôt que sur le modèle.

Plusieurs synthèses 2024-2025 convergent (Anaconda State of Data Science, IBM, Forrester) : la préparation des données reste le poste numéro un de consommation de temps dans les projets IA en entreprise.

En PME, la situation est généralement pire que la moyenne. Les données existent rarement dans un état exploitable : CRM peuplé à la main avec des règles différentes selon les commerciaux, ERP qui contient trois manières d’écrire le même fournisseur, base produits sans nomenclature, exports Excel qui ont remplacé un vrai outil il y a quatre ans. Le prestataire honnête fera un audit data avant de chiffrer. Le prestataire pressé dira « on s’occupera des données en chemin ». La phrase coûte cher.

Concrètement, sur un projet PME à 30 000 € au total :

Si le devis dit « 5 jours de préparation données » et que les données sont en réalité éclatées sur 8 sources, vous payerez 15 à 25 jours.
Si la donnée nominative est partout et qu’aucun audit RGPD n’a été prévu, ajoutez un poste juridique et une refonte des champs sensibles.
Si la complétude est à 40% sur les champs critiques (cas typique d’un CRM PME), vous payerez soit une campagne de ressaisie, soit une dégradation durable des performances du modèle.

Le Baromètre France Num 2025, conduit auprès de 11 021 entreprises dont 3 043 PME, rapporte que 40% des dirigeants déclarent des dépassements de budget sur leurs projets numériques, et que les projets IA custom sur des données stratégiques peuvent dépasser 100 000 €. Ce n’est pas le modèle qui coûte, c’est ce qu’il faut faire à la donnée avant qu’il puisse l’avaler.

Couche 2 : l’itération sur les prompts, une R&D non chiffrée

Le devis classique parle d’un nombre de jours pour « développer l’assistant ». Ce que cette ligne masque, c’est qu’un projet d’IA générative n’est pas du développement linéaire. C’est de la R&D appliquée. On rédige un prompt, on le teste sur 50 cas, on découvre 12 cas où le modèle hallucine, on retravaille, on retest. On change de modèle parce que le nouveau Claude est meilleur sur ce cas précis. On refait une passe de tests. On découvre qu’un edge case casse tout. On itère.

Calcul Jachère : un projet PME typique mobilise 3 à 8 cycles d’itération sur les prompts entre POC et production utile. À 1 jour par cycle, cela représente une ligne budgétaire de 3 000 à 8 000 € rarement isolée dans un devis.

Cette couche est invisible parce qu’elle n’a pas de nom propre dans les propositions commerciales. Elle est enfouie dans « développement », « intégration » ou « POC ». Mais elle représente facilement 20 à 30% du temps réel d’un projet IA générative. Pour un système qui doit travailler sur des contrats, sur du texte juridique, sur des données métier spécifiques, le ratio monte plus haut.

L’effet pervers est que cette couche d’itération est aussi celle qui décide de la qualité finale. Un projet livré sans tests robustes sur les cas limites est un projet qui hallucinera en production. Le dirigeant verra alors la facture continuer à monter post-livraison, pour les corrections que personne n’avait budgétées.

BCG, dans son rapport AI at Work 2025 (10 600 répondants, 11 pays), observe que 85% des dirigeants ont augmenté leur investissement IA en 2025, mais que seulement 37% peuvent démontrer un ROI clair. L’écart entre investissement et valeur s’explique en grande partie par ce que les devis ne nomment jamais : les cycles d’itération nécessaires pour passer d’un modèle qui marche en démo à un modèle qui tient en production.

Couche 3 : maintenance et mises à jour, 15 à 25% par an

C’est la couche dont on ne parle jamais en pitch parce qu’elle vient après la signature, après la livraison, après la photo de fin de projet. Elle est pourtant la plus mécanique des quatre.

Les modèles dérivent. Les données d’entrée changent. Les API des fournisseurs évoluent. OpenAI déprécie une version. Anthropic publie un nouveau modèle qui change le comportement attendu. La base de connaissance métier s’enrichit et doit être réindexée. Les utilisateurs trouvent des cas non couverts qu’il faut traiter. Quelqu’un doit s’occuper de tout ça, en continu.

L’ordre de grandeur converge dans la littérature secteur : entre 15 et 25% du coût de build initial par an, en mode opérationnel courant. Pour un déploiement à 30 000 €, cela représente 4 500 à 7 500 € par an, hors évolutions fonctionnelles. Pour un déploiement à 100 000 €, on est entre 15 000 et 25 000 € par an, donc l’équivalent d’un demi-équivalent temps plein sur cinq ans.

Plusieurs analyses 2024-2025 convergent autour de 15-25% annuel (phData, Qarbon IT, Riseup Labs). Pour les déploiements lourds avec modèles fine-tunés, la fourchette monte jusqu’à 30%.

Le rapport OCDE 2025 sur l’adoption de l’IA par les PME confirme l’angle mort : 39% des entreprises citent les coûts de maintenance comme principal frein à l’approfondissement de leur usage de l’IA, devant les coûts matériels (37%) et juste après le manque de temps de formation (38%). En clair : ce qui freine l’IA en PME, ce n’est pas le coût d’entrée. C’est le coût d’après.

La conséquence économique est nette : un projet IA qui ne réserve pas dès la signature une ligne pluriannuelle de maintenance est un projet condamné à dériver, à se dégrader, et à être abandonné dans les 18 mois. Et la facture cachée, ici, ce n’est pas le coût de maintenance lui-même. C’est le coût d’avoir investi 30 000 € dans un système qui finit par être mis à la corbeille parce que personne ne l’a maintenu.

Couche 4 : dette technique et switching cost

C’est la couche la plus invisible et probablement la plus coûteuse à long terme. Elle se manifeste quand le dirigeant prend deux décisions apparemment banales :

Changer de fournisseur LLM parce que le prix a doublé ou que les performances ont basculé sur un concurrent.
Internaliser ou réinternaliser une partie du système développée initialement par un prestataire.

Dans les deux cas, le devis initial n’a pas chiffré le coût de sortie. Or ce coût existe. Les prompts optimisés sur GPT-4 ne fonctionnent pas tels quels sur Claude ou Gemini : la portabilité d’un prompt entre modèles est largement un mythe entretenu. Chaque modèle a ses forces, ses ratés, ses structures préférées. Un système conçu autour d’un seul fournisseur est de fait verrouillé.

L’API de tool use d’OpenAI ne fonctionne pas comme l’API de tool use d’Anthropic. Les formats JSON acceptés diffèrent. Les comportements de sélection d’outils ne sont pas identiques. Migrer d’un fournisseur à l’autre ne se résume pas à changer une clé d’API. C’est une refonte partielle de l’intégration. Toute organisation qui a fine-tuné un modèle chez un fournisseur, intégré ses retours d’outils dans un format propriétaire, ou bâti son orchestration sur une API spécifique, fera face à un coût significatif de migration le jour où le fournisseur augmente ses prix, déprécie son API ou pivote stratégiquement.

Le rapport OCDE 2025 nuance : pour les usages d’IA générative basés sur des outils grand public, le coût n’est pas le principal frein. C’est le cas pour les usages superficiels (rédaction, brainstorming). Le verrouillage devient critique dès que le projet implique du fine-tuning, des intégrations métier, ou de la donnée propriétaire.

Le fine-tuning, en particulier, est un point de bascule. Un modèle fine-tuné chez OpenAI n’est pas exportable. Si vous avez investi 20 000 € à entraîner GPT-4 sur vos données métier et que vous voulez basculer sur Anthropic, vous repayez l’opération. La même logique vaut pour les intégrations propriétaires : un agent construit autour de l’écosystème Microsoft Copilot n’est pas trivialement portable vers un agent construit sur un autre socle.

La dette technique d’un projet IA mal cadré ressemble à celle d’un projet IT classique, en plus rapide. Chaque court-circuit (« on prend juste cette API, on fera mieux plus tard ») devient une ligne d’engagement difficile à dénouer dans 18 mois.

Pourquoi les agences ne parlent jamais de ces couches en pitch

La question n’est pas morale. Elle est structurelle. Une agence qui chiffrerait honnêtement les quatre couches en pitch présenterait un devis trois fois plus élevé que ses concurrents qui n’en chiffrent qu’une. Elle perdrait la signature. Donc personne ne chiffre, et tout le monde sous-estime au démarrage.

Le mécanisme est simple :

Le devis sert à gagner la signature, pas à décrire le coût réel. Le coût réel se révèle en exécution, à coup de devis complémentaires ou de glissements de scope acceptés par lassitude.
Le dirigeant compare des chiffres apparemment comparables. Trois devis à 8 000 €, 12 000 € et 15 000 € paraissent comparables. En réalité, les périmètres et les couches couvertes ne sont jamais les mêmes. Le moins-disant gagne, mais le moins-disant est aussi celui qui facturera le plus en avenants.
Les couches invisibles sont par construction non chiffrables au moment du devis. Tant qu’un audit data n’a pas été fait, on ne sait pas combien coûtera la préparation. Tant que les cas limites n’ont pas été testés, on ne sait pas combien d’itérations seront nécessaires. Le prestataire honnête le dit. Le prestataire pressé écrit un chiffre rond et croise les doigts.
La culture du forfait tout compris achève l’asymétrie. En PME, le dirigeant préfère un chiffre unique à une décomposition fine. Le prestataire le sait et adapte. La transparence des couches est punie par le marché.

L’étude RAND de 2024, fondée sur 65 entretiens structurés avec des data scientists et ingénieurs expérimentés, a documenté que 80% des projets IA en organisation ne passent pas en production utile, soit deux fois plus que le taux d’échec des projets IT classiques. Les causes racines tournent souvent autour d’un mauvais cadrage économique amont : on a chiffré le modèle, jamais ce qu’il fallait autour.

La méthode : calculer le vrai TCO avant de signer

Le seul antidote à cette dynamique, c’est de forcer le chiffrage explicite des quatre couches avant la signature, et de refuser tout forfait global qui ne distingue pas. Voici une grille opérationnelle que n’importe quel dirigeant peut imposer à n’importe quel prestataire IA.

Demander quatre lignes séparées dans le devis :

Préparation des données. Inclut l’audit initial, le nettoyage, la structuration, l’éventuelle ressaisie. Doit être chiffrée après une séance d’audit, pas avant. Si elle est forfaitisée à 5 jours sans audit, refuser ou exiger un audit préalable séparé.
Modèle et itération. Inclut le développement du système (prompts, chaîne, intégrations LLM) et les cycles d’itération nécessaires pour passer du POC à un livrable fiable. Doit prévoir une enveloppe de tests sur cas limites, pas juste un POC qui marche sur trois exemples.
Intégration aux outils existants. Connexion au CRM, à l’ERP, au site, à l’outil métier. C’est la couche la plus souvent absente des pitchs « assistant IA » qui pourtant ne servent à rien tant qu’ils ne sont pas dans le flux de travail réel.
Maintenance annuelle, sur 3 ans. Pas un engagement vague de « support », un montant chiffré par an avec ce qu’il couvre : monitoring, dérive modèle, mise à jour API fournisseur, ajout raisonnable de cas d’usage.

Trois questions de filtrage avant signature :

Si je décide de basculer de fournisseur LLM dans 18 mois, quel est le coût estimé de migration ? Un prestataire qui répond « zéro, tout est abstrait derrière une couche d’API » ment ou n’a pas réfléchi. Un prestataire qui répond « entre 25 et 40% du coût de build initial, selon le niveau de fine-tuning » est honnête.
Quelles sont les trois lignes les plus susceptibles de glisser en cours de projet, et de combien ? Un prestataire sérieux a une réponse documentée. Un prestataire évasif révèle son inexpérience ou son intérêt à ne pas l’évoquer.
Quel est le plan si la qualité des données s’avère pire que prévu ? La bonne réponse n’est pas « on s’en occupera ». La bonne réponse est « on stoppe, on rechiffre, on décide ensemble si on continue ou si on redécoupe ».

Le vrai TCO d’un projet IA en PME, sur trois ans, est rarement inférieur à 2,5 à 4 fois le devis initial typique. Ce n’est pas une fatalité. C’est une conséquence de la manière dont les couches sont chiffrées, ou plutôt ne le sont pas. Le dirigeant qui force la décomposition avant de signer n’évite pas tous les dérapages. Il les rend prévisibles, comparables, arbitrables. C’est déjà beaucoup.

Refuser un projet IA quand les quatre couches ne sont pas explicitement sur la table est, en 2026, l’un des meilleurs arbitrages économiques qu’un dirigeant de PME puisse rendre. Le coût d’un projet refusé est faible. Le coût d’un projet mal cadré qui meurt à 35 000 € au mois 9 est toujours payé deux fois : une fois en cash, une fois en énergie d’équipe.

Questions fréquentes

Pourquoi un devis IA à 8 000 € peut-il devenir une facture à 35 000 € ?

Parce que le devis chiffre généralement la construction du modèle ou de l'agent, pas la préparation des données (60 à 80% du temps d'un projet selon les études secteur), ni l'itération sur les prompts, ni l'intégration aux outils existants, ni la maintenance. Les couches absentes du devis sont précisément celles qui consomment le plus de temps.

Quel est le bon ordre de grandeur de maintenance annuelle pour un système IA ?

Plusieurs analyses convergent autour de 15 à 25% du coût de build initial par an, en mode opérationnel courant (monitoring, retraining léger, gestion des dérives, mises à jour API). Pour un déploiement à 30 000 €, cela représente 4 500 à 7 500 € par an à provisionner, hors évolutions fonctionnelles.

Le switching cost entre fournisseurs LLM est-il une vraie menace ?

Oui. Les prompts optimisés sur un modèle ne sont pas portables tels quels sur un autre, les API de tool use diffèrent entre OpenAI, Anthropic et Google, et un fine-tuning est verrouillé sur la plateforme d'origine. Gartner anticipe que 60% des organisations feront face à un coût significatif de migration LLM d'ici 2027.

Comment un dirigeant peut-il limiter les surprises avant de signer ?

Demander au prestataire de chiffrer séparément les quatre couches : préparation des données, itération modèle/prompts, intégration aux outils existants, maintenance annuelle. Si une ligne manque ou est forfaitisée à la louche, c'est le signal qu'elle dérapera. Refuser le forfait global tout compris quand la base de données n'a pas été ouverte.

Sources

Étude The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed RAND Corporation · vérifié le 29 avril 2026
Analyse Gartner Predicts 30% of Generative AI Projects Will Be Abandoned After Proof of Concept by End of 2025 Gartner · vérifié le 29 avril 2026
Rapport Generative AI shows rapid growth but yields mixed results S&P Global Market Intelligence · vérifié le 29 avril 2026
Source primaire Baromètre France Num 2025 : numérique et IA dans les TPE-PME Direction générale des Entreprises · vérifié le 29 avril 2026
Rapport AI Adoption by Small and Medium-Sized Enterprises OCDE · vérifié le 29 avril 2026
Contre-source AI at Work 2025 : Momentum Builds, But Gaps Remain Boston Consulting Group · vérifié le 29 avril 2026

Élise Marchessou chiffre les décisions : ROI, coûts d'opportunité, économie de la transformation.

Désaccord, retour, erreur factuelle ? Droit de réponse garanti.