CommencerCommencez gratuitement

RL vs RLHF

Quelle est la différence essentielle entre le Reinforcement Learning (RL) et le Reinforcement Learning from Human Feedback (RLHF) ?

Cet exercice fait partie du cours

<cours>Reinforcement Learning from Human Feedback (RLHF)</cours>
Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice