Définition complète
Un LLM est un modèle de deep learning, généralement de type Transformer, avec plusieurs milliards à centaines de milliards de paramètres, pré-entraîné sur des corpus massifs (web, livres, code). Exemples : GPT-5 (OpenAI), Claude Opus 4 (Anthropic), Gemini 2 Ultra (Google), Mistral Large 2 (Mistral AI), LLaMA 4 (Meta). Capacités : dialogue, raisonnement, génération créative, résumé, traduction, programmation. Utilisation via API ou auto-hébergement (modèles open-source).
Termes liés
Transformer
Architecture de réseau de neurones basée sur le mécanisme d'attention, fondation des LLMs modernes.
Fine-tuning
Adaptation d'un modèle pré-entraîné à une tâche ou domaine spécifique via entraînement supplémentaire.
RAG (Retrieval Augmented Generation)
Technique qui enrichit les réponses d'un LLM par récupération de documents externes pertinents.
Autres termes NLP / LLM
Envie d'aller plus loin que la définition ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.