ComeçarComece de graça

RL vs. RLHF

What is the key difference between Reinforcement Learning (RL) and Reinforcement Learning from Human Feedback (RLHF)?

Este exercício faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício