Comece agoraComece grátis

Entendendo comparação e rating em RLHF

Agora é com você. Imagine que você está projetando um assistente de IA e precisa entender a satisfação do usuário. Você está considerando coletar feedback baseado em comparação ou, alternativamente, em ratings. Mas quais são as diferenças entre os dois? Cada método tem suas próprias características, e escolher o certo pode impactar muito o sucesso do seu produto.

Este exercicio faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

exercicio interativo prático

Transforme teoria em prática com um dos nossos exercicio interativos

Iniciar exercicio