Comment une DSI peut déployer une IA interne sans dépendre d'OpenAI

Début 2023, la question "comment déployer de l'IA d'entreprise ?" avait une réponse simple : connecter une API d'IA générative à quelques documents internes et voir ce que ça donne. Deux ans plus tard, les DSI qui ont emprunté cette voie disposent d'un retour d'expérience plus nuancé — et d'une liste de problèmes qui n'étaient pas apparents au départ.

Les performances sont là. Le problème, c'est tout le reste : dépendance contractuelle à un prestataire unique, données d'entreprise qui transitent par une infrastructure américaine, coûts qui s'envolent avec l'adoption, et conformité RGPD qui reste une zone grise persistante. La dépendance à un fournisseur d'IA cloud n'est pas simplement un risque de souveraineté — c'est un risque stratégique, opérationnel, et de plus en plus réglementaire que les DSI des grandes entreprises françaises ne peuvent plus ignorer.

L'alternative existe. Elle est techniquement mûre. Et les DSI qui l'ont mise en oeuvre en 2024-2025 n'ont pas sacrifié la qualité sur l'autel de la souveraineté.

Le problème de dépendance : ce que les DSI mesurent concrètement

La dépendance à un fournisseur d'IA cloud se manifeste sur plusieurs dimensions que les projets pilotes ne rendent pas visibles.

La dépendance tarifaire. Les modèles de pricing des services d'IA cloud sont favorables au démarrage et défavorables à l'échelle. Un projet pilote à coût marginal devient une charge significative à 500 utilisateurs actifs avec 20 requêtes par jour chacun. Les coûts de tokens — d'autant plus élevés quand les contextes documentaires sont longs — ne sont ni prévisibles ni maîtrisables sans réduire l'usage, ce qui va à l'encontre de l'objectif de déploiement.

La dépendance architecturale. Une solution d'IA construite autour d'une API externe est difficile à migrer. Les index documentaires, les paramètres optimisés, les chaînes de traitement — tout est construit pour un fournisseur spécifique. Un changement de stratégie ou une rupture contractuelle implique de tout reconstruire. Cette dépendance est invisible au moment du projet pilote et visible au moment où elle devient un problème.

La dépendance réglementaire. DORA impose aux entités financières de gérer le risque de concentration ICT. Les organisations soumises à NIS2 doivent démontrer la maîtrise de leur chaîne de sous-traitance ICT. Une IA interne centrale déployée chez un fournisseur américain représente un risque de concentration que les équipes de conformité doivent désormais documenter, justifier, et potentiellement réduire. C'est une pression réglementaire croissante que les DSI ne peuvent pas déléguer à l'équipe commerciale du fournisseur.

Le risque de rupture de service. Une modification de politique d'utilisation — comme les changements répétés de conditions générales chez les grands fournisseurs d'IA — peut contraindre à une migration précipitée. Une défaillance de disponibilité chez le fournisseur affecte directement votre outil interne. La dépendance à une API externe est une dépendance opérationnelle que votre plan de continuité doit intégrer.

L'architecture alternative : ce qui est techniquement possible en 2025

L'architecture alternative repose sur deux composants principaux : un modèle de langage open-weight exécuté localement, et un pipeline RAG (Retrieval-Augmented Generation) grounded sur votre base documentaire interne.

La génération de réponses ne dépend pas d'une API externe. Le modèle s'exécute sur votre infrastructure — serveurs on-premise, cloud privé, ou infrastructure dédiée. Les requêtes et les documents ne quittent pas votre périmètre. Le pipeline RAG — l'indexation des documents, la recherche sémantique, le reranking cross-encoder, la génération de réponses citées — s'exécute également localement, sans appel sortant vers des services tiers.

Ce qui a changé depuis 2023, c'est la qualité des modèles disponibles en open-weight. L'écart de performance entre les meilleurs modèles open-weight et les services cloud de premier plan s'est considérablement réduit pour les cas d'usage d'entreprise. Les tâches que les équipes internes font réellement avec une IA d'entreprise — répondre à des questions sur des documents internes, synthétiser des politiques, naviguer dans des bases de connaissances, produire des réponses citées — ne nécessitent pas les capacités de raisonnement avancées qui différencient encore les modèles frontier. Elles nécessitent une bonne architecture de retrieval et une génération précise et auditée.

Comme le détaille l'article sur le déploiement IA en mode air-gap pour les industries régulées, les organisations qui ont effectué cette migration rapportent des performances suffisantes pour leurs cas d'usage métier — avec une maîtrise complète de leur infrastructure et l'élimination du risque de conformité lié aux transferts de données externes.

Les prérequis techniques réalistes

La question que posent la plupart des DSI est : de quoi avons-nous besoin en termes d'infrastructure, d'équipe, et de gouvernance des données pour que ce soit opérationnel en production ?

Infrastructure. Les modèles open-weight performants nécessitent des ressources GPU pour fonctionner à une latence acceptable pour un usage interactif. La configuration minimale pour un déploiement productif d'une équipe de taille moyenne représente un investissement matériel réel — mais c'est un investissement en capital avec un amortissement sur plusieurs années, pas un coût variable qui augmente avec chaque requête. Les coûts d'amortissement sur 3-4 ans sont, dans la plupart des scénarios à l'échelle d'une grande entreprise, inférieurs aux coûts de licensing cloud.

Équipe. Le déploiement d'une IA interne en mode privé ne nécessite pas de constituer une équipe ML. Il nécessite des compétences en DevOps (déploiement et monitoring), en gestion des données (pipeline d'indexation, qualité documentaire), et en sécurité (contrôles d'accès RBAC, audit). Ces compétences sont celles que les équipes IT d'une DSI mature possèdent déjà ou peuvent développer. Ce que vous évitez, en utilisant une solution packagée souveraine plutôt qu'un projet RAG maison, c'est la nécessité d'avoir des experts en ML pour maintenir les composants de retrieval et de génération.

Gouvernance des données. C'est souvent le prérequis le plus sous-estimé. Un système RAG est aussi fiable que la base documentaire sur laquelle il s'appuie. Si vos documents internes sont fragmentés entre des dizaines d'outils sans cohérence de versioning ni de responsabilité de mise à jour, le système d'IA reflètera cette fragmentation dans ses réponses. La mise en place d'une gouvernance documentaire — propriétaires de domaines, cycles de révision, métadonnées de version — est un prérequis organisationnel avant d'être un défi technique. Le problème de la dégradation silencieuse des connaissances d'entreprise est la principale cause d'échec des projets RAG à moyen terme, quel que soit le fournisseur choisi.

Les pièges à éviter : projets RAG maison vs. solutions packagées souveraines

Le choix devant les DSI qui décident de se passer des grands fournisseurs cloud n'est pas binaire entre "rester cloud américain" et "construire tout en interne". Il existe une troisième voie : des solutions packagées souveraines conçues pour le déploiement en infrastructure privée.

Le piège du projet RAG maison est bien documenté par les équipes qui l'ont vécu. Construire un pipeline RAG de qualité production — indexation avec chunking sémantique adaptatif, reranking cross-encoder, gestion de la fraîcheur documentaire, piste d'audit, contrôles RBAC, interface utilisateur — est un projet d'ingénierie substantiel. La plupart des organisations qui ont lancé des POC RAG en 2023-2024 ont sous-estimé la complexité de maintenance et d'évolution. Les composants qui fonctionnent bien en développement montrent leurs limites en production : qualité de retrieval qui se dégrade à mesure que la base documentaire grossit, absence de monitoring sur la fraîcheur des sources, difficultés d'intégration avec les contrôles d'accès existants.

Les solutions packagées souveraines — conçues pour le déploiement on-premise, avec le pipeline de retrieval, le modèle, et les contrôles de conformité intégrés — réduisent cette charge de manière significative. La DSI déploie un système dont la qualité RAG est validée et maintenue par l'éditeur, sans dépendance à une API cloud externe. C'est le positionnement de Scabera : une solution packagée air-gap, déployable en infrastructure privée, avec des réponses citées et auditables, sans appel à des API externes lors de l'inférence.

L'autre écueil courant concerne la fragmentation des connaissances entre silos départementaux. L'IA interne n'a de valeur que si elle couvre l'ensemble des sources documentaires pertinentes — et non pas uniquement les quelques systèmes pour lesquels un connecteur a été développé lors du POC. Les solutions packagées qui intègrent des connecteurs pour les principales sources documentaires d'entreprise (GED, wikis internes, bases réglementaires, documentation technique) permettent d'atteindre rapidement une couverture opérationnelle.

La question stratégique pour la DSI

La question que les DSI doivent poser en 2025 n'est pas "fournisseur cloud IA ou pas ?" — c'est "où se situe notre seuil de dépendance acceptable vis-à-vis des fournisseurs d'IA cloud, compte tenu de nos obligations réglementaires, de notre appétit pour le risque de concentration, et de notre stratégie de souveraineté numérique ?"

Pour les établissements financiers soumis à DORA, la réponse réglementaire s'impose de plus en plus clairement. Pour les entreprises du secteur de la défense ou des infrastructures critiques NIS2, les contraintes sectorielles orientent vers des architectures souveraines. Pour d'autres secteurs, la réponse est moins tranchée — mais le coût d'opportunité d'une dépendance croissante à l'infrastructure d'un fournisseur unique se mesure au fil des années, pas au moment du projet pilote.

Les DSI qui ont déployé une IA souveraine en infrastructure privée en 2024 ont un retour d'expérience convergent : la qualité est suffisante pour les cas d'usage métier, la maîtrise des coûts est supérieure à l'échelle, et l'absence de risque réglementaire lié aux transferts de données est un avantage opérationnel réel — pas seulement un argument de conformité.

Pour voir comment Scabera accompagne les DSI dans le déploiement d'une IA souveraine en infrastructure privée, demandez une démonstration.

Le problème de dépendance : ce que les DSI mesurent concrètement

L'architecture alternative : ce qui est techniquement possible en 2025

Les prérequis techniques réalistes

Les pièges à éviter : projets RAG maison vs. solutions packagées souveraines

La question stratégique pour la DSI

See Scabera in action