Définition complète
Un embedding transforme un objet discret (mot, phrase, document, image, utilisateur) en vecteur dense de nombres réels, dans un espace où la proximité numérique reflète la proximité sémantique. Base des systèmes RAG, recommandation, recherche sémantique. Modèles courants : OpenAI text-embedding-3, Sentence-Transformers, BGE (Beijing), E5 (Microsoft). Dimension typique : 384 à 3 072.
Termes liés
RAG (Retrieval Augmented Generation)
Technique qui enrichit les réponses d'un LLM par récupération de documents externes pertinents.
Base de données vectorielle
Base de données spécialisée dans le stockage et la recherche rapide de vecteurs d'embeddings.
LLM (Large Language Model)
Grand modèle de langage entraîné sur de vastes corpus textuels pour comprendre et générer du texte naturel.
Autres termes NLP / LLM
Envie d'aller plus loin que la définition ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.