Trainingsbeispiele erstellen
Als Teil eines Kundenservice-Chatbots, den dein Team entwickelt, erstellst du eine Pipeline zur Vorverarbeitung eines Datensatzes. Dieser wird später verwendet, um ein Sprachmodell feinzujustieren, damit es die Absicht einer Kundenfrage vorhersagen und Anfragen an das richtige Team zur Bearbeitung weiterleiten kann.
Du erhältst einen Datensatz mit der Kundenfrage und der Absicht in separaten Spalten und möchtest den Datensatz so vorverarbeiten, dass jede Beispielzeile mit Frage und Absicht in einem einzigen String mit deinem formatierten Prompt zusammengeführt wird.
Der Datensatz ist bereits in dataset geladen. Er enthält die Spalten instruction mit der Kundenfrage und intent für die Absicht des Nutzers.
Diese Übung ist Teil des Kurses
Feinabstimmung mit Llama 3
Anleitung zur Übung
- Erstelle einen Prompt-String mit Instruction und Intent im Format
"Query: {instruction}\nIntent: {intent}". - Vervollständige den Funktionsaufruf mit dem Datensatz, um
create_intent_exampleauf jede Zeile anzuwenden. - Extrahiere und gib den Wert in der Spalte
intent_examplein der ersten Zeile des Datensatzes aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def create_intent_example(row):
# Fill out the columns in the prompt
row['intent_example'] = ____
return row
# Call the ds method to apply our preprocessing function to all rows
processed_dataset = dataset.____(____)
# Print the intent_example in the first row of the processed data
print(processed_dataset[____][____])