Değerlendirme için veri kümelerini filtreleme
Hastanelerin yeni hastaları sisteme alırken kullandığı şirketine ait sağlık sohbet botu için bir eğitim ve değerlendirme hattı (pipeline) kuruyorsun.
Görevin, tıbbi soruları yanıtlama becerisi açısından bir LLM’i değerlendirmek için MedQuad-MedicalQnADataset veri kümesini yükleyen bir hat oluşturmak. dataset_name içinde belirtilen veri kümesinin train bölümünden yalnızca ilk 500 örneği değerlendirme kümesi olarak dahil ederek veri kümesini ds değişkenine yüklemen isteniyor.
Bu egzersiz
Llama 3 ile İnce Ayar (Fine-Tuning)
kursunun bir parçasıdırEgzersiz talimatları
- Gerekli fonksiyon ve sınıfları
datasetspaketinden içe aktar. - Veri kümesini
dsdeğişkenine yükle. dataset_nameiçinde belirtilen veri kümesinintrainbölümünden ilk 500 örneği değerlendirme kümesi olacak şekildedsüzerinde gerekli işlemleri yap.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load neccesary imports from library
from datasets import ____, ____
# Load the training split of the dataset
ds = load_dataset(dataset_name, split=____)
# Filter for the first 500 samples of the dataset
filtered_ds = ____