Une hallucination IA n'est pas un accident mystérieux ni un mensonge volontaire. C'est une conséquence directe du fonctionnement d'un grand modèle de langage : à chaque étape, il prédit le token suivant le plus plausible compte tenu du texte déjà présent.

Cette distinction est fondamentale : le modèle optimise la plausibilité, pas la vérité. Lorsqu'une information manque, il ne s'arrête pas spontanément pour dire « je ne sais pas ». Il peut prolonger la réponse avec une affirmation cohérente, bien formulée et statistiquement probable — mais fausse.

Éviter les hallucinations ne consiste donc pas à trouver une formule magique. Il faut réduire les zones que le modèle doit compléter, ancrer la réponse dans des données contrôlées et définir une cible vérifiable.

Pourquoi une IA hallucine-t-elle ?

Un modèle de langage reçoit du texte, le découpe en tokens, puis calcule une distribution de probabilités pour le token suivant.

Texte reçu
    |
    v
Découpage en tokens
    |
    v
Calcul des continuations probables
    |
    +-- "est"       : 31 %
    +-- "semble"    : 18 %
    +-- "pourrait"  : 12 %
    +-- autres...   : 39 %
    |
    v
Sélection d'un token
    |
    v
Nouveau calcul pour le token suivant

Ce cycle est répété jusqu'à produire la réponse complète. Le modèle ne consulte pas, par défaut, une table interne contenant des faits certifiés. Il exploite des régularités apprises pendant son entraînement : associations entre mots, structures de phrases, formes de raisonnement et motifs fréquemment rencontrés.

Cela explique trois propriétés importantes.

Premièrement, une phrase fluide n'est pas une preuve d'exactitude. La maîtrise de la forme et la validité du contenu sont deux dimensions différentes.

Deuxièmement, le modèle peut combiner des fragments compatibles en apparence : un vrai nom, une date plausible et une référence inexistante. Chaque élément s'insère naturellement dans la phrase, mais l'ensemble ne correspond à aucune réalité.

Troisièmement, le modèle tend à combler les trous. Si le prompt suppose qu'un rapport, une fonction ou une règle existe, il peut accepter cette prémisse et produire les détails attendus au lieu de la contester.

Une hallucination est donc une sortie statistiquement plausible mais factuellement fausse, invérifiable ou absente des données disponibles.

Prompt vague : un espace de réponses presque illimité

Un prompt ne programme pas directement chaque mot de la réponse. Il modifie les probabilités des continuations possibles. Plus il est vague, plus de réponses restent compatibles avec la demande.

PROMPT VAGUE                         PROMPT CADRÉ

\----------------------/             \----------------------/
 \                    /               \  contexte précis   /
  \ sujets possibles/                 \ données fournies /
   \ tons, formats /                   \ cible définie   /
    \ hypothèses   /                    \ contraintes   /
     \ inventions /                      \ format      /
      \ dérive   /                        \ réponse   /
       \       /                           \ ancrée  /
        \_____/                             \_____/

 Espace de sorties large             Espace de sorties réduit
 Plus de trous à combler             Moins d'hypothèses nécessaires

« Explique-moi ce produit » laisse plusieurs questions ouvertes : quel produit, à partir de quelles données, pour quel public, avec quel niveau technique et selon quels critères ?

Le modèle doit implicitement choisir des réponses. Chacun de ces choix ajoute une possibilité de dérive. À l'inverse, un prompt cadré agit comme un entonnoir : il augmente la probabilité des sorties conformes et diminue celle des continuations hors sujet.

Le cadrage ne garantit cependant pas la vérité. Un prompt extrêmement précis fondé sur des données fausses produira souvent une réponse précisément fausse. La qualité dépend à la fois des instructions et de la qualité des sources.

Pourquoi la méthode CONTEXTE → CIBLE fonctionne

La méthode CONTEXTE → CIBLE agit sur deux causes différentes de l'hallucination.

Le contexte conditionne le modèle. Il fournit les informations nécessaires, fixe le périmètre et réduit le nombre d'hypothèses implicites. Le modèle dispose alors de moins de trous à compléter à partir de simples régularités statistiques.

La cible définit le résultat acceptable : contenu attendu, destinataire, niveau de détail, format et critères de réussite. Elle transforme une demande abstraite en production contrôlable.

CONTEXTE                              CIBLE
Ce que le modèle peut utiliser        Ce qu'il doit produire
              \                       /
               \                     /
                v                   v
             Réponse délimitée et vérifiable

Sans contexte, la réponse manque d'ancrage. Sans cible, elle peut être correcte mais inutilisable. Les deux sont nécessaires : le contexte réduit l'incertitude sur les faits, tandis que la cible réduit l'incertitude sur la forme et l'objectif.

Anatomie d'un prompt robuste

Un prompt robuste peut être construit avec sept blocs. Ils ne doivent pas nécessairement être longs, mais chacun doit remplir une fonction identifiable.

+--------------------------------------------+
| RÔLE                                       |
| Position et compétence attendues           |
+--------------------------------------------+
| CONTEXTE                                   |
| Situation, public, périmètre               |
+--------------------------------------------+
| DONNÉES                                    |
| Sources et contenu autorisés               |
+--------------------------------------------+
| CIBLE                                      |
| Résultat exact à obtenir                   |
+--------------------------------------------+
| FORMAT                                     |
| Structure, longueur, syntaxe               |
+--------------------------------------------+
| CONTRAINTES / INTERDITS                     |
| Limites, exclusions, gestion de l'inconnu  |
+--------------------------------------------+
| EXEMPLES                                   |
| Modèles de sorties conformes               |
+--------------------------------------------+
Bloc Question à résoudre Effet mécanique
Rôle Depuis quelle perspective répondre ? Favorise le vocabulaire et les critères pertinents
Contexte Dans quelle situation travaille-t-on ? Réduit les interprétations concurrentes
Données Quelles informations font autorité ? Ancre les affirmations dans un corpus contrôlé
Cible Quel résultat précis est attendu ? Rend la sortie évaluable
Format Comment présenter la réponse ? Réduit la variance de structure
Contraintes Que faut-il éviter ou signaler ? Ferme des branches de réponse indésirables
Exemples À quoi ressemble une bonne sortie ? Montre concrètement le motif attendu

Le rôle seul ne suffit pas. Écrire « Tu es un expert » améliore parfois le registre, mais ne fournit aucune connaissance vérifiable. Le bloc déterminant contre les hallucinations reste celui des données, accompagné d'une règle explicite pour traiter les informations absentes.

Le Markdown, format naturel du travail avec l'IA

L'IA travaille particulièrement bien avec le Markdown, car il s'agit d'un texte brut structuré par des conventions simples : titres, listes, tableaux et blocs de code. Le modèle peut le lire et le produire nativement, sans le bruit d'un balisage lourd ni les difficultés d'extraction d'un format de mise en page.

Le Markdown constitue ainsi une sorte de format bureautique naturel de l'IA. Il peut servir à trois étapes :

  • pour écrire le prompt, avec des titres correspondant aux sections « Contexte », « Données », « Cible » ou « Contraintes » ;
  • pour fournir les documents de référence, car un fichier Markdown est généralement plus propre et moins bruité qu'un PDF ou qu'une page HTML ;
  • pour récupérer la réponse, sous une forme directement réutilisable dans une documentation, une page web ou une base de connaissances.

Le format ne garantit pas l'exactitude du contenu. Il rend toutefois les frontières entre instructions, données et résultat attendu plus explicites. Un contexte bien structuré en Markdown réduit l'ambiguïté et limite donc les branches dans lesquelles le modèle pourrait dériver.

Les techniques anti-hallucination et leur mécanisme

Fournir et ancrer les données

Lorsqu'une tâche dépend de faits précis, fournissez les données dans le prompt ou récupérez-les depuis une source contrôlée. Cet ancrage, ou grounding, réduit la dépendance aux souvenirs approximatifs du modèle.

Le RAG applique ce principe automatiquement : un système recherche des passages pertinents dans une documentation, puis les ajoute au contexte avant la génération.

Question
   |
   v
Données fournies ?
   |
   +-- OUI --> Sources pertinentes ?
   |              |
   |              +-- OUI --> Réponse ancrée + références
   |              |
   |              +-- NON --> Signaler l'insuffisance
   |
   +-- NON --> Connaissance générale suffisante ?
                  |
                  +-- OUI --> Réponse prudente à vérifier
                  |
                  +-- NON --> Risque élevé d'hallucination

Le RAG ne rend pas automatiquement une réponse vraie. Une source obsolète, un mauvais passage récupéré ou une instruction ambiguë peut encore produire une erreur. Il améliore surtout la traçabilité : on peut comparer les affirmations avec les passages utilisés.

Autoriser explicitement « je ne sais pas »

Le modèle a été entraîné à poursuivre le texte et à répondre utilement. Il faut donc rendre l'abstention acceptable :

Si l'information n'apparaît pas dans les données fournies, réponds « information absente des sources ». Ne complète pas par supposition.

Cette instruction ajoute une branche de sortie légitime là où le modèle aurait autrement tendance à improviser. Elle fonctionne mieux si le résultat attendu distingue clairement « absent », « ambigu » et « confirmé ».

Séparer faits et hypothèses

Demander deux sections — « Faits établis » et « Hypothèses » — empêche de présenter toutes les propositions avec le même niveau de certitude.

Cette séparation ne garantit pas que le classement sera parfait, mais elle force une décision explicite. La relecture devient plus efficace : une hypothèse déguisée en fait devient visible.

Fournir des exemples

Le few-shot consiste à montrer quelques entrées et sorties conformes. Les exemples réduisent l'ambiguïté que les seules consignes abstraites laissent subsister.

Un exemple indique notamment le ton, la granularité, le traitement des valeurs manquantes et la structure exacte. Il faut toutefois éviter les exemples erronés : le modèle reproduit aussi leurs défauts.

Découper la tâche

Une demande complexe cumule plusieurs risques : extraction, interprétation, calcul, rédaction et mise en forme. La découper permet de vérifier les résultats intermédiaires.

Pour une tâche factuelle, demandez par exemple :

  1. d'extraire les informations présentes ;
  2. de signaler les champs absents ;
  3. d'effectuer les calculs à partir des seules valeurs extraites ;
  4. de produire la synthèse finale.

Le but n'est pas d'obtenir le raisonnement interne détaillé du modèle, mais des étapes observables et contrôlables.

Réduire la température

La température influence la diversité des tokens sélectionnés. Une température basse favorise les continuations les plus probables et produit généralement des réponses plus stables.

Elle convient aux extractions, classifications et synthèses factuelles. Une température élevée peut être utile pour explorer des idées ou varier un style.

Attention : réduire la température ne corrige pas une connaissance fausse. Cela peut seulement rendre une erreur plus constante. L'ancrage des données reste prioritaire.

Faire rédiger le prompt par l'IA : le méta-prompting

Le méta-prompting consiste à utiliser l'IA pour rédiger, critiquer ou améliorer le prompt qui servira ensuite à réaliser la tâche. Au lieu d'essayer d'écrire immédiatement une consigne parfaite, l'utilisateur décrit son besoin en langage naturel et demande au modèle de le transformer en prompt structuré.

Voici mon objectif et mon contexte. Rédige le prompt idéal selon la méthode « contexte → cible ». Avant de le rédiger, pose-moi les questions nécessaires sur les informations manquantes. N'invente aucune contrainte.

Cette méthode fonctionne pour la même raison qu'un prompt cadré : le modèle sait reconnaître et reproduire des structures telles que le contexte, les données, la cible, le format et les critères de réussite. En lui demandant d'expliciter ces éléments avant de traiter le fond, on réduit l'espace des sorties possibles.

Le point essentiel est la phase de clarification. Une IA qui pose des questions avant de répondre évite de remplacer silencieusement les informations manquantes par ses propres hypothèses. Elle transforme les zones ambiguës en décisions visibles : public visé, sources disponibles, longueur attendue, exclusions ou définition du résultat acceptable.

Le méta-prompting peut prendre la forme d'une boucle d'amélioration :

Besoin formulé par l'humain
            |
            v
Brouillon de prompt
            |
            v
Critique et questions de l'IA
            |
            v
Réponses et corrections humaines
            |
            v
Prompt final relu et validé

Cette boucle ne transfère pas la responsabilité au modèle. L'IA peut sur-spécifier la demande, ajouter des contraintes inutiles ou interpréter un objectif de travers. Le prompt proposé doit donc être relu avant utilisation. Elle ne connaît pas non plus les données privées ou implicites de l'utilisateur : c'est à celui-ci de les fournir explicitement et de décider lesquelles peuvent être transmises.

Mini exemple avant/après

Demande vague de l'humain

Fais-moi un prompt pour analyser un contrat.

Cette demande ne précise ni le type de contrat, ni l'objectif de l'analyse, ni les sources autorisées, ni le niveau de risque acceptable.

Prompt structuré proposé par l'IA

Avant de rédiger le prompt final, demande-moi : le type de contrat, le pays ou cadre juridique concerné, le rôle de la personne qui le fait analyser, les clauses prioritaires et le format de restitution attendu.

À partir uniquement du contrat fourni et des réponses obtenues, relève les obligations, échéances, montants, conditions de résiliation et clauses présentant un risque. Pour chaque point, cite le passage correspondant. Sépare « Éléments explicites », « Ambiguïtés » et « Informations absentes ». N'invente aucune règle juridique et signale les points nécessitant la validation d'un professionnel compétent.

Le méta-prompt ne fournit pas lui-même l'expertise ou les données manquantes. Il construit un cadre dans lequel leur absence devient explicite et contrôlable.

Exemples avant/après

Exemple 1 : synthèse documentaire

Avant

Résume les règles de remboursement et donne les délais.

Ce prompt ne précise ni la source ni la conduite à tenir lorsque le délai manque. Le modèle peut reproduire une règle courante mais inapplicable.

Après

À partir uniquement du document placé entre <source> et </source>, rédige une synthèse destinée au grand public. Sépare « Conditions », « Délais » et « Exceptions ». Pour chaque affirmation, indique le passage source correspondant. Si un délai n'est pas mentionné, écris « délai non précisé ». N'utilise aucune connaissance extérieure.

Le second prompt réduit l'espace de réponse, définit la source d'autorité et rend les affirmations vérifiables.

Exemple 2 : analyse technique

Avant

Analyse ce dysfonctionnement et donne la cause.

Cette formulation pousse vers une cause unique, même si les éléments disponibles ne suffisent pas.

Après

Analyse les journaux fournis sans inventer d'événement absent. Présente : 1. les faits observés, 2. les causes compatibles avec ces faits, 3. les données manquantes pour les départager, 4. les vérifications à effectuer. N'annonce une cause comme certaine que si une preuve explicite la confirme.

Ici, le prompt distingue observation, hypothèse et preuve. Il autorise plusieurs explications et transforme l'incertitude en plan de vérification.

Une réponse fiable reste une réponse vérifiée

Le prompt engineering réduit le risque d'hallucination IA, mais ne remplace pas les contrôles externes. Pour une décision importante, les affirmations doivent être confrontées à une source primaire, un calcul déterministe, une base à jour ou un expert compétent.

Une méthode robuste suit cette chaîne :

Sources contrôlées
        |
        v
Prompt cadré
        |
        v
Réponse avec faits et incertitudes
        |
        v
Validation automatique ou humaine
        |
        v
Utilisation

La règle pratique est simple : ne demandez pas seulement au modèle de « mieux répondre ». Organisez la tâche pour qu'il ait moins à deviner, qu'il puisse s'abstenir et que sa production puisse être contrôlée.

Glossaire

Bases

  • Prompt : texte envoyé au modèle pour lui fournir une demande, des données et des instructions.
  • Prompt système : instruction prioritaire définissant le comportement général, les règles et le rôle du modèle.
  • Contexte : ensemble des informations disponibles pour interpréter et traiter la demande.
  • Fenêtre de contexte : quantité maximale de tokens que le modèle peut considérer lors d'une génération.
  • Cible ou target : résultat attendu, défini par son contenu, son public et ses critères d'acceptation.
  • Feature : fonctionnalité identifiable d'un produit ou d'un système.
  • Prompt engineering : conception, test et amélioration méthodique des prompts.
  • Markdown : langage de balisage léger en texte brut utilisant notamment des titres avec #, des listes, des tableaux et des blocs de code ; format de prédilection pour rédiger des prompts, fournir des documents en contexte et récupérer les réponses de l'IA.

Mécanique du modèle

  • Token : unité de texte manipulée par le modèle ; elle peut représenter un mot, une partie de mot ou un signe.
  • Tokenisation : opération qui découpe le texte en tokens.
  • Modèle de langage ou LLM : modèle entraîné sur de grands corpus pour générer et transformer du langage.
  • Prédiction du token suivant : calcul des continuations probables à partir des tokens déjà présents.
  • Plausibilité vs vérité : distinction entre une formulation statistiquement cohérente et une affirmation conforme aux faits.
  • Hallucination : contenu faux, fabriqué ou non étayé, présenté comme une réponse plausible.
  • Température : paramètre contrôlant la variabilité lors de la sélection des tokens.
  • Top-p / Top-k : méthodes limitant la sélection aux tokens couvrant une probabilité cumulée donnée ou aux k candidats les plus probables.
  • Embedding : représentation numérique d'un contenu permettant d'en comparer la proximité sémantique.

Techniques

  • Zero-shot : demande effectuée sans fournir d'exemple de réponse.
  • Few-shot : méthode consistant à inclure quelques exemples pour montrer le comportement attendu.
  • Chain-of-thought : décomposition d'un problème en étapes de raisonnement ; en pratique, on privilégie des étapes et résultats intermédiaires vérifiables.
  • Grounding ou ancrage : obligation de fonder la réponse sur des données identifiées.
  • RAG : système qui recherche des documents pertinents puis les ajoute au contexte avant la génération.
  • Fine-tuning : entraînement complémentaire adaptant un modèle à des comportements ou données spécialisés.
  • Méta-prompting ou méta-prompt : technique consistant à utiliser l'IA pour générer, critiquer ou améliorer un prompt avant son utilisation.
  • Agent : système utilisant un modèle pour planifier des actions, appeler des outils et observer leurs résultats.
  • MCP ou connecteur : interface standardisée permettant à un modèle d'accéder à des outils et à des sources externes.

Risques et garde-fous

  • Guardrails : règles et contrôles encadrant les entrées, les actions ou les sorties d'un système d'IA.
  • Prompt injection : instruction malveillante intégrée à une entrée ou à un document afin de détourner le comportement prévu.
  • Abstention : capacité attendue à signaler qu'une information est inconnue, absente ou insuffisamment étayée.

Le meilleur prompt anti-hallucination n'est donc pas le plus autoritaire ni le plus long. C'est celui qui fournit les bonnes données, réduit les interprétations possibles, définit une cible contrôlable et traite explicitement l'incertitude.