Entendendo comparação e rating em RLHF
Agora é com você. Imagine que você está projetando um assistente de IA e precisa entender a satisfação do usuário. Você está considerando coletar feedback baseado em comparação ou, alternativamente, em ratings. Mas quais são as diferenças entre os dois? Cada método tem suas próprias características, e escolher o certo pode impactar muito o sucesso do seu produto.
Este exercicio faz parte do curso
Reinforcement Learning from Human Feedback (RLHF)
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio