Glossaire IA générative : 50 termes essentiels expliqués simplement

L’intelligence artificielle générative s’est imposée dans les organisations en quelques mois. Mais le vocabulaire qui l’accompagne reste souvent opaque pour les non-spécialistes. Ce glossaire IA générative rassemble les 50 termes les plus utilisés — définis simplement, sans jargon technique, avec des exemples concrets tirés des usages en collectivités territoriales et en entreprises. Il est conçu pour les agents publics, les élus, les dirigeants et les managers qui veulent comprendre l’IA pour mieux la piloter.

A

Agent IA Un agent IA est un système d’intelligence artificielle capable d’agir de manière autonome pour accomplir une tâche complexe — rechercher des informations, rédiger un document, envoyer un email, mettre à jour une base de données. Contrairement à un simple chatbot qui répond à des questions, un agent IA enchaîne plusieurs actions pour atteindre un objectif. Exemple : un agent IA qui reçoit une demande d’administré, recherche la réglementation applicable, rédige la réponse et l’envoie automatiquement.

Algorithme Un algorithme est une suite d’instructions que suit un programme informatique pour accomplir une tâche. Dans le contexte de l’IA, les algorithmes apprennent à partir de données pour améliorer leurs performances au fil du temps. Exemple : l’algorithme qui classe les emails en “spam” ou “important” apprend à partir de millions d’exemples étiquetés.

API (Application Programming Interface) Une API est une interface qui permet à deux logiciels de communiquer entre eux. Dans le contexte de l’IA, les API permettent d’intégrer des capacités IA (comme ChatGPT ou Mistral) dans des outils existants sans avoir à développer le modèle soi-même. Exemple : une collectivité qui intègre l’API Mistral dans son logiciel de gestion des courriers pour automatiser les réponses aux administrés.

IA Act (AI Act) Le règlement européen sur l’intelligence artificielle (Règlement 2024/1689), entré en application progressive depuis février 2025. Il classe les systèmes IA par niveau de risque et impose des obligations proportionnées : interdiction des systèmes à risque inacceptable, obligations strictes pour les systèmes à haut risque, obligations de transparence pour les systèmes à risque limité, et obligation de formation des agents (Article 4) depuis août 2025.

AI Literacy Terme utilisé dans l’Article 4 de l’IA Act pour désigner le niveau de compréhension minimum que doit avoir toute personne travaillant avec des systèmes d’IA. La littératie IA inclut : comprendre comment fonctionne l’IA, connaître ses limites, savoir évaluer la fiabilité des résultats et connaître les règles de protection des données applicables. La formation à l’AI Literacy est une obligation légale depuis août 2025 pour les agents utilisant l’IA.

Automatisation L’automatisation consiste à confier à un système informatique ou à une machine des tâches répétitives réalisées jusqu’alors par des humains. L’IA générative permet une automatisation de niveau supérieur : elle peut automatiser des tâches cognitives comme la rédaction, la synthèse et l’analyse — pas seulement des tâches mécaniques. Exemple : automatisation de la rédaction des comptes-rendus de conseil municipal.

B

Base de connaissances Une base de connaissances est un ensemble structuré de documents, règlements, procédures et informations qu’un système IA peut consulter pour répondre à des questions. Dans le contexte des collectivités, une base de connaissances peut contenir le règlement intérieur, les procédures RH, les textes réglementaires applicables et les réponses aux questions fréquentes des administrés. Elle est au cœur des systèmes RAG.

Biais algorithmique Un biais algorithmique est une erreur systématique dans les résultats produits par un système IA, due à des données d’entraînement non représentatives ou à des choix de conception inadéquats. Exemple : un système IA de tri de candidatures formé sur des données historiques peut reproduire des discriminations passées. L’IA Act impose des évaluations de biais pour les systèmes à haut risque utilisés dans les décisions administratives.

C

Chatbot Un chatbot est un programme informatique capable de conduire une conversation avec un humain via une interface textuelle ou vocale. Les chatbots de nouvelle génération, basés sur des grands modèles de langage (LLM), peuvent comprendre des questions complexes et générer des réponses nuancées. Exemple : un chatbot sur le site d’une mairie qui répond aux questions des administrés sur les horaires, les démarches administratives et les événements locaux.

ChatGPT ChatGPT est un assistant IA conversationnel développé par OpenAI, basé sur les modèles GPT-4 et GPT-4o. C’est l’outil IA le plus utilisé dans le monde avec plus de 200 millions d’utilisateurs actifs. Dans les collectivités, ChatGPT est fréquemment utilisé de manière non encadrée (shadow IA) pour rédiger des courriers, synthétiser des documents et préparer des présentations. Sa version gratuite envoie les données aux serveurs d’OpenAI aux États-Unis — ce qui pose des questions de souveraineté des données.

Charte IA Document interne qui définit les règles d’usage de l’intelligence artificielle au sein d’une organisation. Une charte IA pour une collectivité territoriale précise quels outils sont autorisés, quelles données ne peuvent pas être saisies dans les outils IA, les règles de validation humaine des contenus générés, les procédures de signalement des incidents et les responsabilités de chaque agent. Elle doit être soumise au Comité Social Territorial pour avis avant mise en application.

Conformité IA Ensemble des mesures prises par une organisation pour respecter les obligations légales liées à l’utilisation de l’intelligence artificielle — notamment l’IA Act et le RGPD. La conformité IA implique : la cartographie des systèmes IA utilisés, l’évaluation des risques, la formation des agents, la rédaction d’une charte IA et la constitution d’un dossier documentaire opposable en cas de contrôle.

Copilot (Microsoft) Copilot est l’assistant IA intégré aux applications Microsoft 365 (Word, Excel, Outlook, Teams, PowerPoint). Il est développé par Microsoft en partenariat avec OpenAI et utilise les modèles GPT-4. Pour les collectivités qui utilisent déjà Microsoft 365, Copilot est souvent la solution d’IA la plus simple à déployer car elle s’intègre dans les outils existants. Les données restent dans le tenant Microsoft de la collectivité, ce qui répond en partie aux exigences RGPD.

D

Data (Données) Les données sont la matière première de l’intelligence artificielle. Les modèles IA apprennent à partir de milliards de données textuelles, visuelles ou sonores. Dans le contexte des collectivités, les données sensibles (données personnelles des administrés, données financières, données médicales) ne doivent jamais être saisies dans des outils IA non sécurisés — c’est une obligation RGPD et une règle fondamentale de la charte IA.

Deep Learning (Apprentissage profond) Le deep learning est une technique d’apprentissage automatique qui utilise des réseaux de neurones artificiels à plusieurs couches pour analyser des données complexes. C’est la technologie qui sous-tend les grands modèles de langage (LLM) comme GPT-4 ou Mistral. Le terme “profond” fait référence au nombre de couches du réseau de neurones — plus il y en a, plus le modèle peut traiter des informations complexes.

DGS (Directeur Général des Services) Dans le contexte de l’IA dans les collectivités, le DGS joue un rôle central : il est responsable de la mise en œuvre de la stratégie IA de la collectivité, de la conformité à l’IA Act et au RGPD, et de la formation des agents. C’est généralement lui qui initie la démarche de cartographie des usages IA et qui valide la charte IA avant soumission au Comité Social Territorial.

E

Embeddings Les embeddings sont des représentations mathématiques (vecteurs) du sens des mots, phrases ou documents. Ils permettent aux systèmes IA de comprendre les relations sémantiques entre les concepts — par exemple que “maire” et “élu municipal” sont des concepts proches. Les embeddings sont au cœur des systèmes RAG qui permettent de rechercher des informations dans une base de connaissances.

Éthique de l’IA L’éthique de l’IA regroupe les principes qui guident un usage responsable et équitable de l’intelligence artificielle. Les principes clés sont : la transparence (expliquer comment l’IA prend ses décisions), l’équité (éviter les discriminations), la responsabilité (maintenir une supervision humaine), la protection de la vie privée (respecter le RGPD) et la robustesse (s’assurer que les systèmes fonctionnent de manière fiable). L’IA Act traduit ces principes éthiques en obligations légales.

F

Fine-tuning Le fine-tuning est un processus d’adaptation d’un modèle IA généraliste à un domaine ou une tâche spécifique. On part d’un modèle pré-entraîné (comme Mistral ou GPT-4) et on l’entraîne sur des données supplémentaires spécifiques à l’organisation. Exemple : une collectivité qui fine-tune un modèle sur ses propres documents réglementaires pour obtenir un assistant IA spécialisé dans ses procédures internes.

Foundation Model Un foundation model (modèle de fondation) est un grand modèle IA entraîné sur des volumes massifs de données qui peut être utilisé comme base pour de nombreuses applications différentes. GPT-4, Mistral, Gemini et Claude sont des foundation models. Ils sont qualifiés de “fondation” car ils servent de base sur laquelle construire des applications spécialisées par fine-tuning ou via des systèmes RAG.

G

GEO (Generative Engine Optimization) Le GEO est l’ensemble des techniques qui optimisent la visibilité d’un site web dans les réponses générées par les moteurs IA comme ChatGPT, Perplexity ou Google AI Overviews. Contrairement au SEO qui vise un classement dans une liste de liens, le GEO vise à être cité comme source dans les réponses directes des IA. Le GEO repose sur : des données structurées Schema.org, un contenu factuel riche en données chiffrées, une autorité d’auteur établie et une empreinte sémantique large.

Gemini (Google) Gemini est la famille de modèles IA développée par Google DeepMind. Il est intégré dans Google Workspace (Gmail, Docs, Sheets) sous le nom “Gemini for Workspace”. Pour les collectivités qui utilisent Google Workspace, Gemini est l’équivalent de Copilot pour Microsoft. Les données traitées par Gemini for Workspace restent dans l’environnement Google de l’organisation.

GPU (Graphics Processing Unit) Un GPU est un processeur spécialisé initialement conçu pour le traitement graphique mais aujourd’hui utilisé pour entraîner et faire fonctionner les modèles IA. Les GPU sont capables de traiter en parallèle d’immenses volumes de calculs — indispensable pour les grands modèles de langage. L’accès aux GPU est l’un des facteurs limitants de la souveraineté numérique en IA, car ils sont principalement produits par NVIDIA, une entreprise américaine.

H

Hallucination En IA, une hallucination désigne la production par un modèle IA d’informations fausses, inventées ou non vérifiables présentées avec assurance. Les LLM peuvent halluciner des citations, des dates, des noms ou des faits qui n’existent pas. C’est l’une des limitations les plus importantes de l’IA générative actuelle. La supervision humaine et la vérification des sources sont indispensables pour détecter et corriger les hallucinations — c’est précisément ce que l’IA Act impose avec l’obligation de maintien d’une supervision humaine.

Haut risque (IA à) Classification définie par l’IA Act pour les systèmes IA qui présentent des risques significatifs pour la santé, la sécurité ou les droits fondamentaux. Les systèmes IA à haut risque sont soumis aux obligations les plus strictes : évaluation de conformité, enregistrement dans une base de données européenne, supervision humaine renforcée. Dans les collectivités, les systèmes IA utilisés pour des décisions affectant les droits des administrés peuvent être classifiés à haut risque.

I

IA générative L’IA générative est une catégorie d’intelligence artificielle capable de créer du contenu original — textes, images, sons, vidéos, code informatique — à partir d’une instruction en langage naturel. Elle se distingue de l’IA analytique (qui analyse des données existantes) par sa capacité à produire du nouveau contenu. Les outils IA génératifs les plus utilisés en collectivités sont ChatGPT, Copilot, Mistral et Gemini pour le texte, et DALL-E ou Midjourney pour les images.

Inférence L’inférence est le processus par lequel un modèle IA génère une réponse à partir d’une requête. Contrairement à l’entraînement (qui nécessite d’immenses ressources de calcul), l’inférence peut être réalisée sur des infrastructures plus légères. La vitesse d’inférence détermine la réactivité d’un outil IA — combien de temps il faut pour obtenir une réponse.

J

Jailbreak Le jailbreak désigne les techniques utilisées pour contourner les garde-fous de sécurité d’un modèle IA — lui faire produire des contenus qu’il est normalement programmé à refuser. Dans le contexte professionnel et réglementaire, le jailbreak des outils IA utilisés en collectivité constitue une violation de la charte IA et potentiellement de l’IA Act. La formation des agents doit sensibiliser à ce risque.

L

LLM (Large Language Model) Un LLM (grand modèle de langage) est un modèle IA entraîné sur des volumes massifs de texte pour comprendre et générer du langage naturel. GPT-4, Mistral, Gemini et Claude sont des LLM. Ils sont capables de rédiger, traduire, résumer, analyser et répondre à des questions dans presque toutes les langues. Les LLM sont le moteur technologique derrière les outils IA génératifs utilisés en collectivités.

Le Chat (Mistral) Le Chat est l’interface conversationnelle de Mistral AI, l’équivalent français de ChatGPT. Il est disponible sur mistral.ai et propose une version Enterprise hébergée en France, conforme au RGPD. Teriagen recommande Le Chat Enterprise comme alternative souveraine à ChatGPT pour les collectivités qui souhaitent traiter des données sensibles avec un outil IA.

M

Machine Learning (Apprentissage automatique) Le machine learning est une branche de l’intelligence artificielle dans laquelle les systèmes apprennent automatiquement à partir de données sans être explicitement programmés. Contrairement aux programmes traditionnels qui suivent des règles fixes, les modèles de machine learning s’améliorent avec l’expérience. L’IA générative repose sur des techniques avancées de machine learning, notamment le deep learning.

Mistral AI Mistral AI est une startup française d’intelligence artificielle fondée en 2023 par d’anciens chercheurs de Google DeepMind et Meta. Elle développe des modèles de langage open source et propriétaires, dont Mistral Large et Mistral Small. Mistral AI est l’acteur français de référence en IA générative et propose des solutions hébergées en France, conformes au RGPD et recommandées pour les collectivités soucieuses de souveraineté numérique.

Multimodal Un système IA multimodal est capable de traiter et de générer plusieurs types de données : texte, images, sons, vidéos. GPT-4o et Gemini sont des modèles multimodaux — ils peuvent analyser une image, transcrire un audio et rédiger un texte dans la même conversation. Dans les collectivités, les usages multimodaux incluent l’analyse de photos pour des rapports d’inspection ou la transcription de réunions.

N

NLP (Natural Language Processing) Le NLP (traitement du langage naturel) est la branche de l’IA qui permet aux machines de comprendre, analyser et générer du langage humain. Toutes les applications d’IA générative de texte reposent sur le NLP. Les avancées récentes du NLP (notamment les transformers et les LLM) ont rendu possible des assistants IA capables de comprendre des questions complexes et de générer des réponses nuancées en langage naturel.

O

Open Source Un modèle IA open source est un modèle dont le code et les paramètres sont publiés librement et peuvent être utilisés, modifiés et déployés par n’importe qui. Mistral AI publie certains de ses modèles en open source. Pour les collectivités, les modèles open source présentent l’avantage de pouvoir être hébergés sur des serveurs internes — ce qui maximise la souveraineté des données. L’IA Act s’applique également aux modèles open source.

P

Perplexity Perplexity est un moteur de recherche IA qui génère des réponses directes aux questions en citant ses sources. Il est particulièrement utilisé par les professionnels pour des recherches documentaires rapides. Contrairement à ChatGPT qui se base principalement sur ses données d’entraînement, Perplexity effectue des recherches en temps réel sur le web pour générer ses réponses. C’est l’un des principaux moteurs génératifs où la visibilité GEO est stratégique.

Prompt Un prompt est l’instruction ou la question que l’on soumet à un système IA pour obtenir une réponse. La qualité du prompt détermine largement la qualité de la réponse — c’est le principe du “prompt engineering”. Un bon prompt est précis, contextuel et indique le format de réponse attendu. Exemple : au lieu de taper “rédige un courrier”, taper “rédige un courrier administratif formel de 150 mots à destination d’un administré pour lui notifier le refus de sa demande de permis de construire, en citant l’article L421-1 du Code de l’urbanisme”.

Prompt Engineering Le prompt engineering est l’art de formuler des instructions précises et efficaces pour obtenir les meilleurs résultats d’un système IA. C’est une compétence clé enseignée dans les formations IA Teriagen — elle permet aux agents de multiplier par 3 à 5 la qualité et la pertinence des réponses obtenues des outils IA.

R

RAG (Retrieval-Augmented Generation) Le RAG est une architecture IA qui combine la génération de texte par un LLM avec la recherche dans une base de connaissances spécifique. Concrètement : au lieu de répondre uniquement à partir de ses données d’entraînement, le système IA recherche d’abord les informations pertinentes dans une base documentaire (règlements, procédures, circulaires) avant de générer sa réponse. Le RAG permet de créer des assistants IA spécialisés sur les documents internes d’une collectivité, tout en limitant les hallucinations.

RGPD (Règlement Général sur la Protection des Données) Le RGPD est le règlement européen qui encadre le traitement des données personnelles. Dans le contexte de l’IA, le RGPD s’articule avec l’IA Act pour créer un cadre complet de protection des données. Les collectivités doivent s’assurer que les outils IA qu’elles utilisent ne traitent pas de données personnelles des administrés en dehors du cadre légal — ce qui implique de choisir des outils conformes RGPD et d’interdire la saisie de données personnelles dans les outils IA grand public.

Référent IA Le référent IA est un agent désigné dans chaque service d’une collectivité comme point de contact pour toutes les questions liées à l’intelligence artificielle. Il assure la diffusion des bonnes pratiques, répond aux questions de ses collègues, signale les incidents et maintient la dynamique d’adoption dans la durée. La mise en place d’un réseau de référents IA est une recommandation de Teriagen et une bonne pratique reconnue par les autorités de contrôle.

S

Shadow IA Le shadow IA désigne l’usage non déclaré et non encadré d’outils IA par les agents dans le cadre de leurs missions professionnelles. En 2026, des études montrent que 60% des agents utilisent des outils IA personnels (ChatGPT, Gemini) sans en informer leur hiérarchie. Le shadow IA crée des risques RGPD (données personnelles saisies dans des outils non sécurisés), des risques IA Act (usage en dehors de tout cadre de gouvernance) et des risques de qualité (résultats non vérifiés publiés sans supervision).

Souveraineté numérique La souveraineté numérique désigne la capacité d’une organisation ou d’un État à maîtriser ses données et ses infrastructures numériques, sans dépendance excessive vis-à-vis d’acteurs étrangers. Pour les collectivités, la souveraineté numérique en IA implique de privilégier des outils IA hébergés en France ou en Europe, dont les données ne sont pas transférées vers des serveurs américains ou chinois. Mistral AI est l’acteur français de référence sur ce sujet.

Système IA Définition légale de l’IA Act : un système IA est un système basé sur une machine qui, pour un ensemble donné d’objectifs définis par l’homme, est capable de générer des résultats tels que des prédictions, des recommandations, des décisions ou du contenu influençant les environnements réels ou virtuels. Cette définition large inclut les chatbots, les outils de rédaction assistée, les systèmes de reconnaissance vocale et les outils d’analyse documentaire.

T

Token Un token est l’unité de base traitée par un modèle de langage. En français, un token correspond approximativement à 3/4 d’un mot. Les modèles IA ont une limite de tokens qu’ils peuvent traiter en une seule fois — appelée “fenêtre de contexte”. Cette limite détermine la longueur maximale des documents qu’on peut soumettre à l’analyse. GPT-4o peut traiter jusqu’à 128 000 tokens, soit environ 96 000 mots — l’équivalent d’un roman entier.

Transformer L’architecture transformer est le modèle mathématique qui sous-tend tous les grands modèles de langage modernes. Introduite par Google en 2017 dans l’article “Attention is All You Need”, elle a révolutionné le traitement du langage naturel en permettant aux modèles de comprendre le contexte global d’un texte, pas seulement les mots adjacents. Tous les LLM modernes (GPT, Mistral, Claude, Gemini) sont basés sur cette architecture.

U

Use Case (Cas d’usage) Un use case IA est une application concrète et identifiée de l’intelligence artificielle à un processus métier spécifique. Dans les collectivités, les use cases IA les plus fréquents sont : la rédaction de courriers administratifs, la synthèse de comptes-rendus de conseil, la recherche réglementaire, la préparation de présentations et la réponse aux questions des administrés. L’identification des use cases est la première étape de l’audit IA Teriagen.

V

Vecteur En IA, un vecteur est une représentation mathématique d’un concept sous forme de liste de nombres. Les modèles IA convertissent les mots, phrases et documents en vecteurs pour pouvoir mesurer mathématiquement leur similarité sémantique. Les bases de données vectorielles sont au cœur des systèmes RAG — elles permettent de retrouver rapidement les documents les plus pertinents pour répondre à une question.

Z

Zero-shot Le zero-shot désigne la capacité d’un modèle IA à accomplir une tâche pour laquelle il n’a reçu aucun exemple spécifique dans sa requête. Contrairement au “few-shot” (où on donne quelques exemples), le zero-shot demande directement au modèle de réaliser la tâche. Exemple de prompt zero-shot : “Rédige un arrêté municipal d’interdiction de stationnement.” Le zero-shot est plus rapide mais souvent moins précis que le few-shot pour des tâches complexes.

Vous souhaitez aller plus loin ?

Ce glossaire est mis à jour régulièrement par les experts Teriagen pour rester à jour avec les évolutions rapides de l’IA générative et de sa réglementation.

Teriagen accompagne les collectivités territoriales et les entreprises dans leur transformation par l’IA générative — de l’audit initial à la formation des agents et à la mise en conformité IA Act.

→ Prendre rendez-vous

Glossaire IA générative : 50 termes essentiels expliqués simplement

A

B

C

D

E

F

G

H

I

J

L

M

N

O

P

R

S

T

U

V

Z

Vous souhaitez aller plus loin ?

SERVICES AUX ENTREPRISES

SERVICES AUX COLLECTIVITÉS

SOCIÉTÉ