Vous avez sans doute déjà hoché la tête en réunion devant un mot que vous n’osiez pas faire répéter. RAG, token, fenêtre de contexte, fine-tuning : le vocabulaire de l’IA a cette particularité agaçante de mélanger l’anglais, le jargon d’ingénieur et le terme marketing, au point qu’on finit par valider une solution sans savoir ce qu’elle fait vraiment. Or pour un avocat, ce flou n’est pas anodin : c’est précisément en ne sachant pas ce qu’est une hallucination qu’on signe des écritures truffées de faux arrêts, et en confondant deux types de comptes qu’on fait fuiter un dossier. Selon Bpifrance Le Lab, dans son étude de juin 2025 sur l’IA dans les PME et ETI françaises, seules 26 % des entreprises utilisent une IA générative, alors que 58 % des dirigeants jugent déjà l’IA importante pour la pérennité de leur entreprise à trois ou cinq ans (France Num). Entre cette urgence ressentie et le passage à l’acte, il y a souvent un fossé de mots qu’on n’a pas osé demander.
Ce glossaire répare ça. Dix-sept termes, une définition juste et vérifiée pour chacun, ce qu’il faut en retenir pour un cabinet, et surtout ce qu’il ne faut pas confondre. Pas de définition approximative qui se voudrait pédagogique mais induirait en erreur : sur ces sujets, l’à-peu-près coûte cher.
Cet article fait partie de notre guide complet de l’IA pour les avocats.
Ce glossaire ne remplace ni le guide du CNB, ni les recommandations de la CNIL, ni l’avis de votre ordre. Pour un cas précis, référez-vous aux sources officielles.
Les briques de base : ce qu’est vraiment une IA générative
Avant les pièges, le socle. Quatre mots qu’on emploie sans cesse et qu’on définit rarement correctement.
LLM (grand modèle de langage)
Un programme entraîné sur d’énormes volumes de texte pour prédire le mot suivant le plus probable. C’est tout, et c’est essentiel : un LLM ne comprend pas, ne consulte aucune base de connaissances. Il calcule, à chaque mot, la suite la plus vraisemblable d’après ce qu’il a vu en entraînement, ce qui explique à la fois sa fluidité bluffante et ses erreurs assurées. Les plus connus sont GPT (OpenAI), Claude (Anthropic), Gemini (Google) et Mistral.
Pourquoi ça compte au cabinet. Comprendre qu’un LLM prédit du texte plausible, et ne récite pas le droit, c’est comprendre d’où vient l’hallucination. Quand vous lui demandez la jurisprudence sur une question, il ne cherche pas : il produit ce qui ressemble à de la jurisprudence.
À ne pas confondre avec une base de données juridique. Un LLM seul n’a pas accès à Légifrance ni à Judilibre en temps réel. Lui faire réciter le droit de mémoire, c’est l’inviter à inventer.
Token (jeton)
L’unité de base que le modèle lit et produit. Un token n’est pas un mot : c’est un fragment, souvent un mot court, un morceau de mot, une terminaison ou une ponctuation. En anglais, un token équivaut en gros à quatre caractères, soit environ trois quarts de mot ; le français et ses accents en consomment un peu plus.
Pourquoi ça compte au cabinet. Les outils d’IA professionnels facturent et plafonnent en tokens, pas en pages ni en mots. Quand un éditeur annonce une limite ou un coût, c’est cette unité qu’il manie, et savoir qu’un long contrat pèse des milliers de tokens aide à anticiper si l’outil le traitera d’un seul tenant.
Fenêtre de contexte (context window)
La quantité maximale de tokens, entrée et sortie réunies, que le modèle peut garder en tête en une seule fois. Au-delà, il oublie le début. Les modèles de 2025 et 2026 vont d’environ 128 000 tokens à plus d’un million selon l’offre.
Pourquoi ça compte au cabinet. C’est elle qui détermine si vous pouvez coller un dossier entier, un long contrat ou un jeu de conclusions d’un seul coup, ou s’il faut découper. Une fenêtre trop courte, et le modèle perd le fil entre le début et la fin de votre pièce.
À ne pas confondre avec la mémoire. La fenêtre de contexte se réinitialise à chaque nouvelle conversation. La mémoire à long terme, elle, persiste d’une session à l’autre : deux mécanismes distincts. Les confondre, c’est croire qu’un outil a oublié ce qu’on lui avait dit hier, ou au contraire qu’il l’a retenu.
GenAI (IA générative)
Le sous-ensemble de l’IA qui crée du contenu nouveau (texte, image, audio, code) au lieu de seulement classer ou prédire. Elle s’oppose à l’IA dite traditionnelle, qui analyse sans produire d’œuvre originale : détection de fraude, scoring, classification de documents.
Pourquoi ça compte au cabinet. Toute IA n’est pas générative. Quand un éditeur vend de l’IA, savoir s’il s’agit de génération de texte ou d’un simple classement de pièces change l’analyse de conformité.
Le geste : prompt, copilote, agent
Comment on parle à ces outils, et jusqu’où on les laisse agir.
Prompt
L’instruction qu’on donne au modèle : la consigne, le contexte et la question réunis. La qualité du prompt détermine très largement celle de la réponse. Un prompt précis, qui fixe un rôle, un contexte et un format de sortie attendu, transforme un résultat vague en livrable utilisable.
Pourquoi ça compte au cabinet. Un prompt bien construit sépare un brouillon de conclusions exploitable d’une bouillie générique. C’est une compétence qui s’apprend, souvent le vrai levier de gain de temps, davantage que l’outil lui-même. Nos articles sur la recherche juridique assistée et le résumé de dossier volumineux détaillent des prompts conçus pour interdire l’invention.
Copilote (copilot)
Un assistant IA intégré dans un outil que vous utilisez déjà (suite bureautique, logiciel métier, gestionnaire de courrier) qui suggère et assiste pendant que vous gardez la main. Le terme vient de l’idée de co-pilotage : l’humain reste pilote.
Pourquoi ça compte au cabinet. Un copilote accélère une tâche sans la déléguer : il propose une reformulation ou une trame, vous validez ou corrigez, la responsabilité reste clairement la vôtre. C’est le bon niveau d’autonomie pour un avocat.
Agent IA
Un système où un LLM utilise des outils en boucle, de manière autonome : il dirige lui-même ses étapes (chercher, appeler un service, vérifier, recommencer) au lieu de suivre un script figé. Anthropic le définit comme un système où les modèles dirigent dynamiquement leurs propres processus et l’usage de leurs outils (Building Effective AI Agents).
Pourquoi ça compte au cabinet. Un agent qui agit seul, c’est plus de gain potentiel mais aussi plus de surface de risque, en particulier quand il lit des pièces et déclenche des actions. C’est précisément là que la prompt injection (plus bas) devient un sujet sérieux.
À ne pas confondre avec un copilote ni avec un simple chatbot. Un copilote assiste un humain qui décide ; un chatbot répond mais n’agit pas ; un agent, lui, enchaîne des actions de son propre chef.
Le risque numéro un : hallucination, et comment on l’atténue
Hallucination
Quand le modèle présente une information fausse ou inventée comme si elle était factuelle, avec aplomb et dans une forme crédible : références juridiques inexistantes, numéros de pourvoi fabriqués, fausses jurisprudences, chiffres sortis de nulle part. Ce n’est pas un bug occasionnel, c’est une conséquence directe du fonctionnement probabiliste du LLM, qui produit ce qui ressemble à une réponse même quand il ne sait pas.
Pourquoi ça compte au cabinet. C’est le risque cardinal, et il est déjà sanctionné : aux États-Unis, l’affaire Mata v. Avianca a valu une amende à des avocats pour six décisions inventées par ChatGPT. La règle ne souffre aucune exception : toute donnée chiffrée, citation ou référence légale produite par l’IA se vérifie à la source primaire avant usage.
À ne pas confondre avec une simple erreur. Une erreur découle d’une donnée incomplète. Une hallucination, c’est une fabrication présentée comme un fait, ce qui la rend bien plus dangereuse parce qu’elle est convaincante.
RAG (génération augmentée par la recherche)
Une technique qui branche le LLM sur une base documentaire externe (vos documents, votre fonds, votre base de clauses). Avant de répondre, le système va chercher les passages pertinents et les fournit au modèle comme contexte. Le sigle vient de l’anglais Retrieval-Augmented Generation. Le RAG réduit le risque d’hallucination, sans l’éliminer, car la réponse s’appuie alors sur des sources réelles et à jour plutôt que sur la mémoire du modèle.
Pourquoi ça compte au cabinet. C’est la technologie derrière un outil qui répond à partir de vos documents : une legaltech qui cite ses sources, un assistant interrogeant votre base de jurisprudence ou votre bibliothèque de modèles. Pour un avocat, le RAG est le bon réflexe technique, car il rattache chaque réponse à une pièce vérifiable. Mais il ne rend pas le modèle infaillible : on vérifie toujours la pièce citée.
À ne pas confondre avec le fine-tuning. Le RAG ne touche pas au modèle, il lui fournit des documents au moment de la question. C’est la distinction la plus importante de ce glossaire.
Fine-tuning (affinage, spécialisation)
Réentraîner un modèle généraliste sur un jeu de données spécifique pour ajuster ses paramètres et l’adapter à un domaine ou à un style. Le savoir est alors incorporé durablement dans le modèle.
Pourquoi ça compte au cabinet. Le fine-tuning sert à inculquer un ton ou un format récurrent (la trame de vos courriers, votre style de conclusions). Il est mal adapté à des données qui changent souvent ou à la vérification factuelle.
La différence clé avec le RAG. Le fine-tuning modifie le modèle par apprentissage durable d’un comportement ; le RAG le laisse intact et lui sert des documents à la volée. Pour des données qui évoluent ou de la vérification, c’est le RAG ; pour un style maison récurrent, le fine-tuning. Confondre les deux mène à acheter la mauvaise solution.
Température
Un réglage, souvent gradué de 0 à 1 (parfois jusqu’à 2), qui contrôle le degré d’aléatoire des réponses. Une température basse, autour de 0,1 ou 0,2, donne des réponses focalisées, prévisibles et répétables. Une température haute, à partir de 0,7, donne des réponses plus variées et créatives.
Pourquoi ça compte au cabinet. Pour une tâche où l’exactitude prime (extraire une date d’un acte, résumer fidèlement, comparer deux clauses), on baisse la température. Quand on traite du droit, la créativité d’un modèle n’est pas un atout mais un risque. Quand un outil professionnel le permet, ce réglage mérite d’être au plus bas.
Les mots de la sécurité et de la confidentialité
C’est ici que le vocabulaire devient un enjeu déontologique direct.
Biais (biais algorithmique)
Une distorsion systématique d’un système d’IA qui désavantage certains groupes ou reproduit des stéréotypes. Il provient des données d’entraînement, de la conception et de l’usage, et peut s’introduire à toutes les étapes.
Pourquoi ça compte au cabinet. Dès qu’une IA assiste un tri (de candidatures, de dossiers) ou un scoring, elle peut produire un résultat discriminatoire sans la moindre intention. Pour un avocat conseil en droit social ou en conformité, c’est un sujet de fond, pour ses clients comme pour ses propres outils.
Jailbreak
Une manipulation visant à contourner les garde-fous et les règles de sécurité programmés dans le modèle, pour lui faire produire ce qu’il devrait refuser. Le jailbreak vise le modèle lui-même et la façon dont il a été formé à la sécurité.
Pourquoi ça compte au cabinet. C’est moins un risque pour votre pratique quotidienne qu’un sujet à connaître pour ne pas le confondre avec son cousin bien plus pertinent, la prompt injection.
Prompt injection (injection de prompt)
Une attaque où un contenu malveillant caché, glissé dans un document, un email ou une page web que l’IA lit, détourne les instructions du système pour lui faire exécuter autre chose. Elle vise l’application et le flux de données, pas seulement le modèle. C’est le risque numéro un du classement de référence en sécurité, le OWASP LLM Top 10, sous l’intitulé LLM01:2025 (OWASP GenAI Security Project).
Pourquoi ça compte au cabinet. Dès qu’une IA est branchée sur vos outils et lit des pièces que vous lui soumettez, attention à ce que vous lui faites lire : un PDF piégé reçu d’une partie adverse peut contenir des instructions cachées et donner des ordres à votre assistant. Le risque grandit avec l’autonomie de l’agent.
À ne pas confondre avec le jailbreak. Le jailbreak force le modèle à enfreindre ses propres règles ; la prompt injection glisse des instructions cachées dans les données qu’il traite. Pour un cabinet, c’est la seconde qui mérite le plus d’attention.
Opt-in et opt-out
L’opt-in désigne l’accord explicite donné par l’utilisateur avant un traitement : une case cochée volontairement, jamais pré-cochée. L’opt-out désigne l’inverse : le traitement a lieu par défaut, et c’est à l’utilisateur d’agir pour s’y opposer ou se retirer.
Pourquoi ça compte au cabinet. Beaucoup d’outils grand public sont en opt-out : vos saisies servent par défaut à entraîner le modèle, sauf si vous le désactivez à la main. Savoir distinguer les deux régimes, c’est savoir si vos données partent par défaut ou seulement sur accord explicite, une question directement liée au secret professionnel.
RGPD et données
Quand vous envoyez des données personnelles à une IA, vous restez responsable de traitement et l’éditeur devient sous-traitant, ce qui suppose un contrat (article 28 du RGPD). Le règlement prévoit six bases légales (article 6), dont le consentement et l’intérêt légitime.
Pourquoi ça compte au cabinet. Voici le piège à éviter absolument. La CNIL, dans ses recommandations IA de juin 2025, considère que le développement d’un système d’IA ne nécessite pas systématiquement le consentement et que l’intérêt légitime est l’une des bases légales les plus couramment mobilisées, en particulier par les organismes privés (CNIL, intérêt légitime et IA). Ce qui s’impose alors, c’est l’information des personnes et le respect de leur droit d’opposition. Dire « il faut le consentement, l’opt-in, pour utiliser une IA sur des données » est donc juridiquement inexact au sens de la CNIL. Pour le cadre complet appliqué au cabinet, voyez notre article dédié au RGPD et à la sécurité des données du cabinet.
À ne pas confondre. L’intérêt légitime n’est pas un blanc-seing : il suppose information et proportionnalité. Mais il n’est pas non plus le consentement.
Version grand public ou version entreprise (Team, Enterprise)
La version grand public (ChatGPT gratuit ou Plus, par exemple) est pratique pour tester, mais elle peut réutiliser vos saisies pour l’entraînement, ne s’accompagne d’aucun contrat de sous-traitance et n’offre pas de garanties professionnelles. Les versions Team et Enterprise (ou Business) n’entraînent pas les modèles sur vos contenus par défaut, ajoutent des contrôles d’administration et un contrat de traitement des données.
Pourquoi ça compte au cabinet. C’est sans doute la distinction la plus directement liée au secret professionnel. Pour des données de clients, on n’utilise pas la version gratuite grand public. Une offre Team ou Enterprise lève le risque principal de réutilisation, sans dispenser de pseudonymiser les éléments les plus sensibles ni de vérifier le lieu d’hébergement. Des équivalents existent chez les autres éditeurs, comme Claude for Work ou Mistral Le Chat Pro.
À ne pas confondre avec un simple abonnement payant. Payer un ChatGPT Plus reste une version grand public côté traitement des données. Ce qui change le régime, c’est le passage à une offre Team, Enterprise ou Business, avec son contrat.
Le vrai blocage de l’IA au cabinet n’est presque jamais technique. C’est un mot qu’on n’a pas osé faire répéter, et une case qu’on n’a pas pensé à décocher.
Garder la main, maintenant que les mots sont posés
Ces dix-sept termes ne sont pas du décor. Ils dessinent une ligne claire : ce que l’IA fait (prédire du texte plausible), ce qu’elle ne fait pas (garantir un fait juridique), et les réglages qui séparent un usage maîtrisé d’un dérapage. Qui sait ce qu’est une hallucination ne signe pas de faux arrêts ; qui distingue version grand public et Enterprise ne fait pas fuiter un dossier ; qui connaît la prompt injection se méfie d’un PDF reçu d’une partie adverse. Pour prolonger ces réflexes, la veille juridique automatisée montre comment garder une source fiable, et l’article usages et déontologie replace tout cela dans le cadre du CNB.
Pour transformer ce vocabulaire en pratique réelle, la formation IA part des usages concrets d’un cabinet, et elle est finançable. Et pour savoir quels usages feraient gagner du temps au vôtre sans vous exposer côté secret professionnel, le diagnostic IA fait l’état des lieux en quelques minutes.
Sources
- Bpifrance Le Lab, « L’IA dans les PME et ETI françaises : une révolution tranquille » (juin 2025, enquête auprès de 1 209 dirigeants de PME et ETI de plus de 10 salariés), repris par France Num : 26 % des PME et ETI utilisent une IA générative, 58 % des dirigeants jugent l’IA importante pour la pérennité de leur entreprise à trois ou cinq ans.
- CNIL, Développement des systèmes d’IA : recommandations sur l’intérêt légitime et fiches pratiques IA (publiées en juin 2025) : l’intérêt légitime comme l’une des bases légales les plus courantes, information et droit d’opposition.
- OpenAI, Enterprise privacy : non-entraînement des modèles sur les contenus Team, Enterprise et API par défaut.
- Anthropic, Building Effective AI Agents : définition de référence d’un agent par rapport à un workflow.
- OWASP GenAI Security Project, LLM01:2025 Prompt Injection : la prompt injection en tête du LLM Top 10.
- Définitions techniques (LLM, token, fenêtre de contexte, RAG, fine-tuning, température) recoupées sur la documentation produit d’OpenAI et d’Anthropic et les ressources IBM Think.
Rédigé par IA, validé par humain. Aucun éditeur cité ne nous rémunère. Cet article ne remplace ni le guide du CNB, ni les recommandations de la CNIL, ni l’avis de votre ordre.