ComenzarEmpieza gratis

Extracción de prompts

Estás trabajando con el conjunto de datos hendrydong/rlhf_helpful_eval, que contiene texto conversacional entre un usuario (Human) y un asistente (Assistant). Tu objetivo es limpiar el texto para preparar un prompt en el que solo aparezca el contenido relevante, sin patrones ni etiquetas específicas.

Elige la opción que usarías para limpiar el conjunto de datos y extraer los prompts. Puedes ver un fragmento del conjunto de datos ejecutando el siguiente código en la consola:

evaluation_data.iloc[range(1)]['text'][0]

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio