RL vs RLHF
Quelle est la différence essentielle entre le Reinforcement Learning (RL) et le Reinforcement Learning from Human Feedback (RLHF) ?
Cet exercice fait partie du cours
<cours>Reinforcement Learning from Human Feedback (RLHF)</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice