Creación de muestras de entrenamiento
Como parte de un chatbot de atención al cliente que vuestro equipo está construyendo, estás creando una canalización para preprocesar un conjunto de datos que finalmente se usará para afinar un modelo de lenguaje y que pueda predecir la intención de la pregunta de un cliente y dirigir las solicitudes al equipo correcto para su tramitación.
Se te proporciona un conjunto de datos con la pregunta del cliente y su intención en columnas separadas, y quieres preprocesarlo para que cada ejemplo que contiene la pregunta y la intención quede combinado en una única cadena con tu prompt formateado.
El conjunto de datos ya está cargado en dataset. Contiene las columnas instruction con la pregunta del cliente e intent con la intención del usuario.
Este ejercicio forma parte del curso
Ajuste fino con Llama 3
Instrucciones del ejercicio
- Crea una cadena de prompt con la instrucción y la intención con el formato
"Query: {instruction}\nIntent: {intent}". - Completa la llamada de función con el conjunto de datos para aplicar
create_intent_examplea cada fila. - Extrae e imprime el valor de la columna
intent_exampleen la primera fila del conjunto de datos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def create_intent_example(row):
# Fill out the columns in the prompt
row['intent_example'] = ____
return row
# Call the ds method to apply our preprocessing function to all rows
processed_dataset = dataset.____(____)
# Print the intent_example in the first row of the processed data
print(processed_dataset[____][____])