Full definition
L'agent interagit avec un environnement, effectue des actions, reçoit des récompenses (positives ou négatives), et ajuste sa stratégie pour maximiser les récompenses cumulées. Applications : jeux (AlphaGo, Dota 2), robotique, trading algorithmique, optimisation de systèmes, RLHF pour LLMs.
Related terms
Other Machine Learning terms
Machine Learning (apprentissage automatique) — Sous-discipline de l'IA qui permet aux machines d'apprendre ...Feature engineering — Processus de création et sélection de variables pertinentes ...Apprentissage supervisé — Paradigme ML où l'algorithme apprend à partir de données éti...Apprentissage non supervisé — Paradigme ML où l'algorithme découvre seul des structures da...Surapprentissage (Overfitting) — Modèle qui apprend trop précisément les données d'entraîneme...Validation croisée (Cross-validation) — Technique pour évaluer la généralisation d'un modèle en déco...
Want to go beyond the definition?
AI2 trains in AI and data with RNCP-certified programs.