Menyimpan himpunan data yang telah dipraproses
Sebagai bagian dari proyek chatbot layanan pelanggan, Anda kini telah menyiapkan himpunan data untuk fine-tuning model Llama. Langkah berikutnya adalah menyimpan himpunan data tersebut agar Anda dapat memuatnya kembali nanti tanpa harus mengulangi langkah praproses. Ini akan memungkinkan tim Anda untuk menggunakan ulang himpunan data tersebut di berbagai eksperimen dan iterasi.
Latihan ini adalah bagian dari kursus
Fine-Tuning dengan Llama 3
Petunjuk latihan
- Simpan himpunan data yang telah dipraproses
dske disk. - Muat himpunan data yang disimpan ke variabel baru
ds_preprocessed. - Cetak elemen pertama dari
ds_preprocessed.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)