Extracción de prompts
Estás trabajando con el conjunto de datos hendrydong/rlhf_helpful_eval, que contiene texto conversacional entre un usuario (Human) y un asistente (Assistant). Tu objetivo es limpiar el texto para preparar un prompt en el que solo aparezca el contenido relevante, sin patrones ni etiquetas específicas.
Elige la opción que usarías para limpiar el conjunto de datos y extraer los prompts. Puedes ver un fragmento del conjunto de datos ejecutando el siguiente código en la consola:
evaluation_data.iloc[range(1)]['text'][0]
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio