ComenzarEmpieza gratis

Entrenamiento, ajuste y retroalimentación

Estás trabajando en un proyecto para desarrollar un modelo utilizando la técnica de Aprendizaje por Refuerzo a través de la Retroalimentación Humana (RLHF) para optimizar su rendimiento en un entorno de atención al cliente.

¿Cuál de estas opciones describe mejor el proceso RLHF?

Este ejercicio forma parte del curso

Conceptos de grandes modelos lingüísticos (LLM)

Ver curso

Ejercicio interactivo práctico

Convierte la teoría en acción con uno de nuestros ejercicios interactivos

Empieza a hacer ejercicio