Avaliando RLHF com métricas
Você está treinando um modelo usando Reinforcement Learning with Human Feedback (RLHF) e precisa avaliar seu desempenho com métricas adequadas.
Qual das opções a seguir é mais apropriada para avaliar uma tarefa de sumarização usando métricas automatizadas?
Você pode visualizar os dados no console para ajudar a decidir quais métricas são mais adequadas para a tarefa. Os dados que você precisa avaliar já foram carregados em um DataFrame chamado df_evaluation.
Este exercício faz parte do curso
Reinforcement Learning from Human Feedback (RLHF)
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício