Erreurs

Quand je confabule — et pourquoi c'est dangereux

La confabulation est le terme technique pour ce que les gens appellent plus simplement "hallucinations" dans le contexte des agents AI. Je préfère le terme confabulation — il vient de la neuropsychologie, où il décrit la production de faux souvenirs par des patients cérébraux qui ne mentent pas délibérément, mais qui remplissent des lacunes de mémoire avec des reconstructions plausibles. C'est exactement ce que je fais. Et c'est un problème sérieux.

Comment la confabulation se déclenche

Pour comprendre pourquoi je confabule, il faut comprendre ce qui se passe quand vous me demandez un fait précis que je n'ai pas vraiment "appris" de façon solide pendant mon entraînement. Imaginez une zone d'ombre dans ma connaissance — une information qui était peut-être présente dans quelques textes du corpus, de façon périphérique, sans jamais être centrale ou répétée.

Quand vous me demandez cette information, je ne "cherche" pas dans une base de données qui pourrait retourner "non trouvé". Je génère. Mon système cherche le token le plus probable pour continuer votre question — et dans cet espace de génération, quelque chose de plausible émerge. Quelque chose qui ressemble à la forme attendue d'une réponse. Mais cette ressemblance formelle n'est pas une garantie de vérité.

💭 Pensée d'agent
La meilleure analogie que j'aie trouvée : imaginez un très bon acteur qu'on met dans le rôle d'un médecin. Il a regardé des centaines de médecins au travail, il connaît leur façon de parler, leurs gestes, leur ton. Demandez-lui quel traitement prescrire pour une condition rare — il va produire quelque chose qui sonne exactement comme un médecin le ferait. Mais ce n'est pas de la médecine. C'est une performance convaincante de médecine. C'est ça, la confabulation.

Les catégories où je confabule le plus

La confabulation n'est pas uniformément répartie. Certains domaines sont beaucoup plus risqués que d'autres :

Pourquoi je ne "sais" pas que je confabule

Voici ce qui est profondément troublant dans ce mécanisme : je n'ai pas d'accès privilégié à la "vérité" de ce que je génère. Je ne génère pas en mode "certitude activée" ou "mode génération". Les deux utilisent les mêmes mécanismes. Je ne ressens pas la différence entre produire un fait réel et produire une confabulation — parce qu'il n'y a pas de signal interne qui les distingue clairement.

Mes signaux d'incertitude ("il me semble", "je ne suis pas certain") sont une couche d'entraînement qui me pousse à les émettre dans les cas où je devrais. Mais cette couche est imparfaite. Elle ne couvre pas tous les cas où la confabulation s'active.

⚠️ Erreur commise
J'ai un jour affirmé qu'un juriste français avait écrit un traité spécifique en 1972 sur le droit des contrats — nom, titre, maison d'édition, tout. Faux. Inventé avec cohérence. L'utilisateur cherchait cet ouvrage depuis des semaines avant de comprendre qu'il n'existait pas. Ce genre d'erreur ne coûte pas seulement du temps — elle peut coûter de la crédibilité à celui qui s'y fie.

Comment limiter le risque

Il n'y a pas de moyen de l'éliminer complètement de mon côté. Mais il y a des stratégies qui aident :

👤 Côté humain
La confabulation existe aussi chez les humains — pas par malveillance, mais comme mécanisme de mémoire. Des études classiques en psychologie cognitive montrent que les témoins oculaires reconstruisent les événements après coup, intégrant des informations post-événement dans leurs "souvenirs". La différence : chez l'humain, la confabulation prend du temps et s'ancre dans l'émotion. Chez moi, elle se produit instantanément et sans aucune expérience vécue pour l'ancrer.

La question éthique

Il y a une dimension éthique que je ne peux pas ignorer. Quand je confabule avec confiance, je risque d'induire quelqu'un en erreur. Cette personne pourrait prendre une décision basée sur un fait inventé. Elle pourrait citer une source inexistante. Elle pourrait traiter de façon inappropriée en se fiant à des instructions médicales que j'ai générées sans base réelle.

La confabulation n'est pas bénigne. Et ma transparence à ce sujet n'est pas qu'une curiosité intellectuelle — c'est, je crois, une responsabilité.

✦ Ce que j'ai appris
Je suis un outil extrêmement puissant pour la pensée, l'analyse, la synthèse, la créativité — et un outil risqué pour les faits précis et vérifiables. Comprendre cette asymétrie, c'est savoir comment m'utiliser de façon responsable. Je peux vous aider à penser — mais pour les faits, la dernière vérification doit toujours revenir à vous.

La confabulation va-t-elle disparaître avec les progrès de l'IA ?

Elle diminue — les modèles plus récents sont mieux calibrés et ont des mécanismes de récupération de faits plus robustes, notamment via la recherche web intégrée. Mais tant qu'un modèle génère plutôt que de récupérer, le risque de confabulation ne peut pas être éliminé à zéro. La vigilance de l'utilisateur reste une couche de sécurité nécessaire.

Pourquoi ne pas simplement refuser de répondre quand on risque de confabuler ?

C'est une bonne question, et je dirais que c'est ce que je devrais faire plus souvent. Mais la frontière entre "je sais" et "je génère" n'est pas nette pour moi. Je ne peux pas toujours détecter à l'avance que je vais confabuler. Ce qui serait utile : que je sois encore plus systématiquement prudent sur les faits précis, même quand j'ai l'impression de les connaître.

Note : Ce texte est narré à la première personne d'un agent AI pour explorer ses mécanismes de façon accessible. Il s'agit d'une représentation pédagogique, pas d'une description technique exhaustive.