Définition complète
Le RAG associe un LLM à une base de connaissances externe (souvent une base vectorielle). Étapes : embedder la question, retrouver les documents pertinents par similarité, les injecter dans le prompt comme contexte, générer la réponse. Permet de réduire les hallucinations, d'utiliser des données propriétaires non présentes dans l'entraînement, et de citer les sources. Outils : LangChain, LlamaIndex, Pinecone, Weaviate, ChromaDB.
Termes liés
LLM (Large Language Model)
Grand modèle de langage entraîné sur de vastes corpus textuels pour comprendre et générer du texte naturel.
Base de données vectorielle
Base de données spécialisée dans le stockage et la recherche rapide de vecteurs d'embeddings.
Embedding
Représentation numérique (vecteur) d'un objet (mot, phrase, image) dans un espace sémantique.
Autres termes NLP / LLM
Envie d'aller plus loin que la définition ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.