Entendendo comparação e rating em RLHF
Agora é com você. Imagine que você está projetando um assistente de IA e precisa entender a satisfação do usuário. Você está considerando coletar feedback baseado em comparação ou, alternativamente, em ratings. Mas quais são as diferenças entre os dois? Cada método tem suas próprias características, e escolher o certo pode impactar muito o sucesso do seu produto.
Este exercício faz parte do curso
Reinforcement Learning from Human Feedback (RLHF)
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício