Menyiapkan argumen pelatihan Llama
Anda ditugaskan bekerja dengan model Llama yang digunakan dalam chatbot layanan pelanggan dengan melakukan fine-tuning pada data layanan pelanggan yang dirancang untuk penjawaban pertanyaan. Untuk memastikan kinerja terbaik dari model ini, tim Anda akan melakukan fine-tuning model Llama untuk tugas ini menggunakan himpunan data bitext.
Anda ingin menjalankan uji coba loop pelatihan untuk memeriksa apakah skrip pelatihan berfungsi. Jadi, Anda ingin memulai dengan menetapkan learning rate kecil dan membatasi pelatihan hanya pada beberapa langkah di dalam argumen pelatihan Anda.
Latihan ini adalah bagian dari kursus
Fine-Tuning dengan Llama 3
Petunjuk latihan
- Impor dan instansiasikan kelas pembantu untuk menyimpan argumen pelatihan Anda.
- Atur argumen pelatihan untuk learning rate ke nilai
2e-3.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load helper class for the training arguments from the correct library
from ____ import ____
training_arguments = ____(
# Set learning rate
____=____,
warmup_ratio=0.03,
num_train_epochs=3,
output_dir='/tmp',
per_device_train_batch_size=1,
gradient_accumulation_steps=1,
save_steps=10,
logging_steps=2,
lr_scheduler_type='constant',
report_to='none'
)