Comece agoraComece grátis

Avaliando RLHF com métricas

Você está treinando um modelo usando Reinforcement Learning with Human Feedback (RLHF) e precisa avaliar seu desempenho com métricas adequadas.

Qual das opções a seguir é mais apropriada para avaliar uma tarefa de sumarização usando métricas automatizadas?

Você pode visualizar os dados no console para ajudar a decidir quais métricas são mais adequadas para a tarefa. Os dados que você precisa avaliar já foram carregados em um DataFrame chamado df_evaluation.

Este exercicio faz parte do curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

exercicio interativo prático

Transforme teoria em prática com um dos nossos exercicio interativos

Iniciar exercicio