Avaliando RLHF com métricas
Você está treinando um modelo usando Reinforcement Learning with Human Feedback (RLHF) e precisa avaliar seu desempenho com métricas adequadas.
Qual das opções a seguir é mais apropriada para avaliar uma tarefa de sumarização usando métricas automatizadas?
Você pode visualizar os dados no console para ajudar a decidir quais métricas são mais adequadas para a tarefa. Os dados que você precisa avaliar já foram carregados em um DataFrame chamado df_evaluation.
Este exercicio faz parte do curso
Reinforcement Learning from Human Feedback (RLHF)
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio