Membuat sampel pelatihan
Sebagai bagian dari chatbot layanan pelanggan yang sedang tim Anda bangun, Anda membuat pipeline untuk prapemrosesan himpunan data yang nantinya akan digunakan untuk fine-tuning sebuah model bahasa agar dapat memprediksi maksud pertanyaan pelanggan dan meneruskan permintaan ke tim yang tepat untuk diproses.
Anda diberikan himpunan data dengan pertanyaan dan maksud pelanggan pada kolom terpisah, dan Anda ingin melakukan prapemrosesan sehingga setiap contoh yang memuat pertanyaan dan maksud digabung menjadi satu string dengan prompt berformat yang Anda tentukan.
Himpunan data sudah dimuat dalam dataset. Himpunan data ini memiliki kolom instruction berisi pertanyaan pelanggan, dan intent untuk maksud pengguna.
Latihan ini adalah bagian dari kursus
Fine-Tuning dengan Llama 3
Petunjuk latihan
- Buat string prompt dengan instruction dan intent dalam bentuk
"Query: {instruction}\nIntent: {intent}". - Lengkapi pemanggilan fungsi dengan himpunan data untuk menerapkan
create_intent_exampleke setiap baris. - Ekstrak dan cetak nilai pada kolom
intent_exampledi baris pertama himpunan data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def create_intent_example(row):
# Fill out the columns in the prompt
row['intent_example'] = ____
return row
# Call the ds method to apply our preprocessing function to all rows
processed_dataset = dataset.____(____)
# Print the intent_example in the first row of the processed data
print(processed_dataset[____][____])