Comprender comparación y puntuación en RLHF
Ahora te toca a ti. Imagina que estás diseñando un asistente de IA y necesitas entender la satisfacción de las personas usuarias. Estás valorando recopilar feedback basado en comparaciones o, alternativamente, en puntuaciones. Pero, ¿cuáles son las diferencias entre ambos? Cada método tiene sus propias características, y elegir el adecuado puede influir mucho en el éxito de tu producto.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio