Creare esempi di training
Come parte di un chatbot per l'assistenza clienti che il tuo team sta sviluppando, stai creando una pipeline per il preprocessing di un insieme di dati che verrà poi usato per il fine-tuning di un modello linguistico, così che possa prevedere l'intento della domanda di un cliente e indirizzare le richieste al team corretto per l'elaborazione.
Ti viene fornito un insieme di dati con la domanda del cliente e l'intento in colonne separate, e vuoi eseguirne il preprocessing in modo da unire ogni esempio contenente domanda e intento in un'unica stringa con il tuo prompt formattato.
L'insieme di dati è già caricato in dataset. Contiene le colonne instruction con la domanda del cliente e intent per l'intento dell'utente.
Questo esercizio fa parte del corso
Fine-tuning con Llama 3
Istruzioni dell'esercizio
- Crea una stringa di prompt con instruction e intent nel formato
"Query: {instruction}\nIntent: {intent}". - Completa la chiamata di funzione con l'insieme di dati per applicare
create_intent_examplea ogni riga. - Estrai e stampa il valore nella colonna
intent_examplenella prima riga dell'insieme di dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def create_intent_example(row):
# Fill out the columns in the prompt
row['intent_example'] = ____
return row
# Call the ds method to apply our preprocessing function to all rows
processed_dataset = dataset.____(____)
# Print the intent_example in the first row of the processed data
print(processed_dataset[____][____])