Définition complète
L'agent interagit avec un environnement, effectue des actions, reçoit des récompenses (positives ou négatives), et ajuste sa stratégie pour maximiser les récompenses cumulées. Applications : jeux (AlphaGo, Dota 2), robotique, trading algorithmique, optimisation de systèmes, RLHF pour LLMs.
Termes liés
Autres termes Machine Learning
Machine Learning (apprentissage automatique) — Sous-discipline de l'IA qui permet aux machines d'apprendre ...Feature engineering — Processus de création et sélection de variables pertinentes ...Apprentissage supervisé — Paradigme ML où l'algorithme apprend à partir de données éti...Apprentissage non supervisé — Paradigme ML où l'algorithme découvre seul des structures da...Surapprentissage (Overfitting) — Modèle qui apprend trop précisément les données d'entraîneme...Validation croisée (Cross-validation) — Technique pour évaluer la généralisation d'un modèle en déco...
Envie d'aller plus loin que la définition ?
AI2 forme à l'IA et à la data avec des programmes certifiés RNCP.