ComeçarComece de graça

Avaliando RLHF com métricas

Você está treinando um modelo usando Reinforcement Learning with Human Feedback (RLHF) e precisa avaliar seu desempenho com métricas adequadas.

Qual das opções a seguir é mais apropriada para avaliar uma tarefa de sumarização usando métricas automatizadas?

Você pode visualizar os dados no console para ajudar a decidir quais métricas são mais adequadas para a tarefa. Os dados que você precisa avaliar já foram carregados em um DataFrame chamado df_evaluation.

Este exercício faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício