Cabinet AI.telier · Tours, France · Préimpression
Atelier d'intégration IA industrielle : protocole en quatre actes et résultats sur 14 dossiers
Auteurs.Yoann ⟨yoann@aitelier.fr⟩, Jean ⟨jean@aitelier.fr⟩
21 mai 2026 · Réf. AT-2026-04 · v.1.0
Résumé
Nous décrivons un protocole en quatre actes (cadrage, prototype, production, clôture) pour l'intégration d'intelligence artificielle dans des opérations industrielles. Médian observé sur N = 14 dossiers : 14 semaines (± 2) entre brief signé et mise en production, 47.2 % (± 1.5) de tâches répétitives absorbées, 99.7 % (± 0.3) de disponibilité système ciblée. Nous discutons les conditions sous lesquelles un système IA survit au-delà du premier trimestre en production, par opposition au prototype d'évaluation qui ne tient pas la première mise à jour [1].
Mots-clés. intégration IA, agents, RAG, infrastructure souveraine, p99, MTTR, production, observabilité.
§1.Introduction
Le marché de l'intelligence artificielle en entreprise se caractérise, en 2026, par une accumulation rapide de prototypes d'évaluation (POC) dont la mortalité en production reste élevée. Le motif observé est régulier : un système est démontré sur des données d'évaluation, adopté avec enthousiasme, puis échoue à la première mise à jour de l'environnement applicatif ou de la distribution des données.
Cette préimpression formalise la méthode que notre cabinet applique depuis 2024 pour livrer des systèmes IA qui survivent. Elle ne propose pas un cadre théorique. Elle documente une pratique courte (deux ingénieurs, un atelier à Tours) et reproductible. Les chiffres rapportés au §4 sont médians, mesurés sur quatorze dossiers clients [2].
§2.Méthode
Le protocole comprend quatre actes ordonnés. Chaque acte produit un livrable signé. Aucun acte ne commence avant que le précédent ait été accepté par le client.
§2.1Cadrage signé
Un atelier de 90 minutes, gratuit, sans engagement. Le client décrit son opération, ses contraintes, le contexte de la donnée. Nous esquissons un plan, en présence, puis le signons des deux côtés. La rencontre est soit en personne à Tours, soit par visioconférence. Le livrable est une page A4 manuscrite numérisée, fournie au format PDF dans les 24 heures.
§2.2Prototype sur données réelles
Deux à trois semaines de développement, exclusivement sur les données réelles du client et dans les outils existants (CRM, ERP, bases vectorielles, files de message). Aucun dataset de démonstration ne sera utilisé. Le prototype est fonctionnel, testable par l'équipe du client, et conçu pour révéler les modes de défaillance avant la production.
§2.3Mise en production et instrumentation
La production n'est pas un jalon ; c'est une discipline. Nous instrumentons (traces, journaux, métriques de qualité de réponse), surveillons les dérives de distribution, réentraînons à fréquence convenue. Cette phase dure quatre à huit semaines selon la complexité du système. L'objectif posé est la stabilité à p99 sous SLA défini en §2.1.
Un indicateur composite est suivi (équation 1) :
MTTRpost = MTTRpre × 0.53 ± 0.04 (1)
§2.4Lettre de clôture
À la fin du dossier, nous transmettons un mémo de clôture. Il contient : la portée du système livré, ce qui a été coupé du plan initial et la raison, les défauts résiduels connus, et nos recommandations pour les six mois suivants. Le mémo est conçu pour être transmis à un comité exécutif sans relecture.
§3.Capacités techniques
Le cabinet maintient quatre pratiques, volontairement étroites. La règle est qu'aucune pratique ne soit annoncée sans qu'elle ait été passée en production sur un dossier réel.
§3.1Intégration de processus
Cartographie des workflows existants, identification des étapes à fort levier, greffe de modèles dans les outils du client. La méthode privilégie l'insertion discrète à la réécriture. Modèles utilisés : LLM privés (Llama 3.1, Mistral) lorsque la souveraineté des données l'impose ; modèles propriétaires (Anthropic, OpenAI) sinon [3].
§3.2Workflows agentiques
Agents avec usage d'outils, mémoire à court et long terme, garde-fous métiers. Orchestration via n8n, Make, ou orchestrateurs sur mesure selon les contraintes d'exécution. La règle est qu'un agent ne soit jamais déployé sans une stratégie de retour-arrière explicite et testée.
§3.3Infrastructure souveraine
Installation de piles auto-hébergées sur GPU dédiés : base de vecteurs (pgvector), observabilité (OpenTelemetry, Grafana), serving (vLLM, Ollama selon le profil de charge). Cloud public possible quand l'analyse de souveraineté l'autorise. L'objectif est que le client puisse opérer la pile sans nous, six mois après la clôture.
§3.4Applications IA-natives
Produits web sur mesure (Nuxt 4, Next 15, Supabase, Vercel AI SDK) dans lesquels le modèle vit dans l'expérience, plutôt qu'à côté. Interface en streaming, génération incrémentale, raccourcis prédictifs. La règle est qu'aucune fonctionnalité IA ne soit présentée comme distincte du produit dans la barre de navigation [4].
§4.Résultats
Les valeurs ci-dessous sont médianes, mesurées sur N = 14 dossiers clôturés entre 2024 et 2026. Les tolérances sont des écarts inter-quartiles approximés, non des écarts-types. Les conditions de mesure sont reportées en [5].
| Grandeur | Médiane | Tolérance |
|---|---|---|
| Délai brief → mise en production | 14 sem. | ± 2 |
| Tâches répétitives absorbées (proportion) | 47.2 % | ± 1.5 |
| Disponibilité système ciblée (mensuelle) | 99.7 % | ± 0.3 |
| Réduction MTTR en exploitation (cf. §2.3) | × 0.53 | ± 0.04 |
| Ingénieurs au dossier (constant) | 2 | ± 0 |
Le rapport P(stable_en_prod | brief_signé) ≈ 0.87 a été calculé en marquant comme stables les systèmes encore en production six mois après la lettre de clôture (équation 2).
P(stable+6m | brief_signé) = 12 / 14 ≈ 0.857 (2)
§5.Discussion et conditions
Le protocole décrit ici fonctionne sous trois conditions. Premièrement, le cabinet n'engage qu'un nombre restreint de dossiers en parallèle ; la disponibilité courante est discutée au cadrage. Deuxièmement, le client doit fournir un accès en lecture aux données réelles dès la fin du cadrage ; sans cet accès, le prototype glisse vers la démonstration et le résultat se détériore. Troisièmement, la décision d'exploitation, après la lettre de clôture, revient au client ; nous ne facturons pas d'astreinte au-delà du sixième mois post-clôture.
Les lecteurs intéressés peuvent ouvrir un dossier de cadrage par courriel à hello@aitelier.fr, avec une description courte du contexte. Le délai de réponse observé est inférieur à 48 heures ouvrées. Le devis est transmis sous cinq jours ouvrés [6].
La référence AT-2026-04 doit être citée en objet du courriel pour faciliter le suivi.
Bibliographie
- [1] Sur la mortalité des prototypes IA en production : l'estimation interne du cabinet place la survie post-première-mise-à-jour entre 22 % et 35 % pour les prototypes construits sur datasets d'évaluation. La méthodologie de mesure est documentée dans AT-2026-protocole-mesure.pdf, disponible sur demande.
- [2] Échantillon de quatorze dossiers clôturés entre janvier 2024 et avril 2026. La composition sectorielle est : industrie manufacturière (5), services financiers régionaux (4), édition logicielle (3), distribution (2).
- [3] Le choix entre LLM privés et propriétaires s'effectue après l'analyse de souveraineté en §2.1. La pile auto-hébergée recommandée s'appuie sur Ollama et vLLM pour le serving, et pgvector pour la base de vecteurs.
- [4] Pile de référence pour les applications IA-natives : Nuxt 4 ou Next 15 selon l'écosystème client, Supabase pour la persistance applicative et l'authentification, Vercel AI SDK pour les patterns de streaming et la composition d'agents côté UI.
- [5] Conditions de mesure des tolérances : les durées sont en semaines calendaires. La disponibilité est mesurée mensuellement sur l'intervalle des six premiers mois en exploitation. Le MTTR est observé sur les incidents marqués sévérité 1 et 2.
- [6] Le cabinet répond à toute demande de cadrage sous moins de quarante-huit heures ouvrées. La disponibilité opérationnelle est précisée à cette occasion. Adresse de contact : hello@aitelier.fr.