ComenzarEmpieza gratis

Comprender comparación y puntuación en RLHF

Ahora te toca a ti. Imagina que estás diseñando un asistente de IA y necesitas entender la satisfacción de las personas usuarias. Estás valorando recopilar feedback basado en comparaciones o, alternativamente, en puntuaciones. Pero, ¿cuáles son las diferencias entre ambos? Cada método tiene sus propias características, y elegir el adecuado puede influir mucho en el éxito de tu producto.

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio