MulaiMulai sekarang secara gratis

Memfilter himpunan data untuk evaluasi

Anda sedang membangun pipeline pelatihan dan evaluasi untuk chatbot layanan kesehatan perusahaan Anda, yang digunakan rumah sakit untuk melakukan onboarding pasien baru.

Tugas Anda adalah membuat pipeline untuk memuat MedQuad-MedicalQnADataset guna mengevaluasi kemampuan sebuah LLM dalam menjawab pertanyaan medis. Anda diminta memuat himpunan data ke dalam variabel ds, dan hanya menyertakan 500 sampel pertama dari split train dari himpunan data yang disimpan dalam dataset_name sebagai himpunan evaluasi Anda.

Latihan ini adalah bagian dari kursus

Fine-Tuning dengan Llama 3

Lihat Kursus

Petunjuk latihan

  • Impor fungsi dan kelas yang diperlukan dari datasets.
  • Muat himpunan data ke dalam variabel ds.
  • Manipulasi ds agar hanya menyertakan 500 sampel pertama dari split train dari himpunan data yang disimpan dalam dataset_name sebagai himpunan evaluasi Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load neccesary imports from library
from datasets import ____, ____

# Load the training split of the dataset
ds = load_dataset(dataset_name, split=____)

# Filter for the first 500 samples of the dataset
filtered_ds = ____
Edit dan Jalankan Kode