Blog | Scabera

Un commercial utilise un assistant IA pour rédiger une proposition client. L'IA puise dans la base de connaissances interne, structure un document propre et cite un niveau de tarification issu d'une fiche produit. Le problème : cette fiche produit a été mise à jour pour la dernière fois il y a 14 mois. Les prix sont incorrects de 23 %. La proposition est envoyée. Le client demande pourquoi le devis final est plus élevé. La transaction s'effondre.

Ce n'est pas un scénario hypothétique. C'est une catégorie d'échec qui survient régulièrement dans les déploiements d'IA en entreprise, et elle ne se résout pas en utilisant un meilleur modèle. Elle se résout en comprenant d'où vient la confiance sans preuve — et en l'éliminant architecturalement.

Le problème des hallucinations est un problème de données, pas de modèle

Le terme « hallucination » donne l'impression que le modèle est défectueux. Il ne l'est pas. Le modèle fait exactement ce pour quoi il a été entraîné : produire un texte fluide, cohérent et confiant à partir du contexte fourni. Le problème vient du fait que la récupération a livré un contexte de mauvaise qualité — obsolète, incomplet ou d'une pertinence ambiguë — et que le modèle n'avait aucun moyen de le savoir.

Les grands modèles de langage sont optimisés pour paraître confiants. C'est un atout dans la plupart des situations. Dans un système RAG d'entreprise, cela devient un risque lorsque la couche de récupération échoue silencieusement. Le modèle ne dit pas « Je ne suis pas sûr de ce chiffre de tarification. » Il dit « L'offre entreprise est facturée 4 200 $ par utilisateur et par an » — parce que c'est ce qu'indique le document récupéré, et générer cette phrase est précisément ce que le modèle est censé faire.

La plupart des récupérations RAG s'effectuent via la similarité cosinus sur des embeddings vectoriels denses. Ce procédé retourne des documents sémantiquement proches de la requête, et non des documents factuellement exacts sur l'affirmation spécifique. Une requête sur les tarifs actuels récupérera des documents de tarification — y compris les anciens, les versions de brouillon, les variantes régionales et les niveaux obsolètes — car tous sont sémantiquement proches. Le modèle reçoit un contexte bruité et produit une synthèse confiante de ce bruit.

Le mode d'échec est invisible jusqu'à ce qu'il ne le soit plus. Les sorties semblent correctes. Elles citent de vrais documents. Les utilisateurs leur font confiance. Les erreurs s'accumulent jusqu'à ce qu'une transaction ratée, un incident de conformité ou un client désorienté fasse remonter le problème — généralement des mois après le déploiement.

Ce que les citations obligatoires imposent réellement sur le plan architectural

Une IA adossée à des citations est fondamentalement différente d'une « IA qui résume vos documents ». La distinction est une contrainte sur la génération, pas une étiquette.

Dans une configuration RAG standard, le modèle reçoit un contexte récupéré et génère une réponse. Il peut — et c'est ce qu'il fait — combiner, interpoler et extrapoler à partir des passages récupérés. Si la récupération a omis un détail pertinent, le modèle comble le manque à partir de sa mémoire paramétrique. Ce comblement est invisible pour l'utilisateur. Aucun signal n'indique que cette phrase particulière provient des données d'entraînement du modèle plutôt que de votre base de connaissances.

Les systèmes à citations obligatoires fonctionnent différemment. Le modèle est contraint de n'affirmer que ce qu'il peut ancrer à un passage récupéré spécifique. Chaque affirmation factuelle renvoie à une source. Si le modèle ne trouve pas de passage récupéré étayant une affirmation, il ne la formule pas — il signale le manque à la place. Le résultat peut indiquer : « Je ne dispose pas d'un document de tarification actuel pour les comptes entreprise APAC dans votre base de connaissances. » Ce n'est pas un échec. C'est le système qui fonctionne correctement.

Cette contrainte a un effet secondaire qui compte : elle force la qualité de récupération à la surface. Lorsque le modèle ne peut pas répondre parce que la récupération a échoué, vous savez que la récupération a échoué. Sans citations, cet échec se cache dans une réponse au ton confiant. Avec des citations, le manque apparaît immédiatement, pointant directement vers ce qui manque dans la base de connaissances.

Le mécanisme d'application architectural est une combinaison de contraintes au niveau du prompt et de vérification post-génération. Le modèle est instruit de générer avec des citations en ligne et se voit attribuer un format de sortie structuré qui rend les affirmations non citées identifiables. Un second passage vérifie que chaque passage cité existe dans le contexte récupéré. Les affirmations qui ne peuvent être vérifiées par rapport au contexte récupéré sont soit signalées, soit supprimées. Zéro hallucination n'est pas un argument commercial — c'est le résultat obtenu lorsque la génération est conditionnée à la récupération.

L'argument de la piste d'audit

Dans les secteurs réglementés, la question « qu'a dit l'IA, et d'où tenait-elle cette information ? » n'est pas un débat sur les fonctionnalités d'un produit. C'est une exigence de conformité.

La FINRA exige que les communications avec les clients soient supervisées et auditables. Si un assistant IA rédige une réponse à une demande client, il doit exister un enregistrement des informations utilisées et de leur provenance. « Le modèle a généré ceci » n'est pas une piste d'audit. « Le modèle a cité la section 4.2 de la Convention client de détail, version 2.3, mise à jour le 14 septembre 2025 » en est une.

La HIPAA exige de même que l'accès aux informations de santé protégées soit consigné avec suffisamment de détails pour permettre une enquête en cas de violation. Si un assistant IA de santé fait remonter des recommandations cliniques, chaque sortie doit être traçable jusqu'à son document source pour démontrer que l'information provient de références cliniques approuvées, et non de la mémoire paramétrique du modèle.

La piste d'audit créée par les citations ne sert pas uniquement aux enquêtes de conformité. Elle permet une surveillance proactive. Vous pouvez interroger les journaux de citations de votre système IA pour demander : combien de sorties ce mois-ci ont cité des documents datant de plus de 12 mois ? Quels domaines de connaissance sont les plus fréquemment cités ? Y a-t-il des sujets sur lesquels le modèle répond en citant des sources peu fiables ? Ces questions ne sont posables que si les citations existent.

Pourquoi les parties prenantes lui font davantage confiance

La dynamique d'adoption de l'IA en entreprise n'est pas principalement portée par les capacités — elle est portée par la confiance. Les équipes capables de vérifier le travail de l'IA l'adoptent plus rapidement et l'utilisent plus largement. Les équipes qui ne peuvent pas le vérifier l'utilisent avec prudence, dans des contextes à faibles enjeux uniquement, la traitant comme un outil de rédaction plutôt qu'un système d'information fiable.

La boucle de transparence fonctionne ainsi : un utilisateur reçoit une réponse générée par IA avec trois citations en ligne. Il en clique une. Elle ouvre le passage exact dans le document source. Le passage dit exactement ce que l'IA a rapporté. La confiance de l'utilisateur augmente. Il utilise à nouveau le système. Il commence à s'appuyer sur lui pour des requêtes à enjeux plus élevés. L'adoption s'étend.

L'inverse est également vrai. Un système IA qui produit des réponses fluides sans sources entraîne les utilisateurs à se demander « mais est-ce vraiment exact ? » à chaque sortie. La charge de vérification efface le gain de productivité. Les utilisateurs reviennent à la recherche manuelle de documents parce qu'au moins, ils savent qu'ils ont trouvé la source eux-mêmes.

L'IA adossée à des citations réduit le fossé de confiance. La source est là. L'utilisateur n'a pas à faire confiance au modèle — il peut consulter le document. C'est une relation fondamentalement différente entre un utilisateur et un système IA, et cela change ce pour quoi les gens sont prêts à l'utiliser.

L'approche Scabera

Chaque réponse générée par le Glass Box AI de Scabera inclut des citations en ligne liées à leurs passages sources. Le système n'affirmera pas un fait qu'il ne peut pas sourcer. Si la récupération ne retourne rien de pertinent, le résultat le dit. Si la récupération retourne des sources ambiguës, le résultat reflète cette ambiguïté.

Ceci est imposé au niveau de la génération, et non comme une étiquette de post-traitement. Le modèle opère sous des contraintes qui rendent l'affirmation non citée structurellement impossible dans le format de sortie. L'intégrité des citations est vérifiée avant que la réponse ne soit délivrée à l'utilisateur.

Les contrôles de sortie ajoutent une seconde couche : les administrateurs peuvent configurer exactement quelle quantité de contexte récupéré quitte le système, quels domaines de connaissance sont accessibles à quels utilisateurs, et ce qui est journalisé à des fins d'audit. La base de connaissances reste dans votre environnement. Les citations pointent vers cet environnement. La piste d'audit est complète parce que l'ensemble du pipeline — récupération, reclassement, génération, citation — s'exécute dans votre infrastructure.

Le résultat n'est pas seulement une IA moins susceptible d'halluciner. C'est un système de gestion des connaissances où chaque sortie est un enregistrement vérifiable et auditable de ce que la base de connaissances de l'organisation contient actuellement — et où sont les lacunes.

Pourquoi les citations sont indispensables dans l'IA d'entreprise

Le problème des hallucinations est un problème de données, pas de modèle

Ce que les citations obligatoires imposent réellement sur le plan architectural

L'argument de la piste d'audit

Pourquoi les parties prenantes lui font davantage confiance

L'approche Scabera

Prêt à synchroniser vos connaissances ?