ComeçarComece de graça

Entendendo comparação e rating em RLHF

Agora é com você. Imagine que você está projetando um assistente de IA e precisa entender a satisfação do usuário. Você está considerando coletar feedback baseado em comparação ou, alternativamente, em ratings. Mas quais são as diferenças entre os dois? Cada método tem suas próprias características, e escolher o certo pode impactar muito o sucesso do seu produto.

Este exercício faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício