Evaluar RLHF con métricas
Estás entrenando un modelo usando reinforcement learning with human feedback (RLHF) y necesitas evaluar su rendimiento con métricas adecuadas.
¿Cuál de las siguientes sería la más adecuada para evaluar una tarea de resumen mediante métricas automatizadas?
Puedes visualizar los datos en la consola para ayudarte a decidir qué métricas se adaptan mejor a la tarea. Los datos que necesitas evaluar ya se han cargado en un DataFrame llamado df_evaluation.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio