ComeçarComece de graça

RL vs. RLHF

Qual é a principal diferença entre Reinforcement Learning (RL) e Reinforcement Learning from Human Feedback (RLHF)?

Este exercício faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício