Değerlendirme için veri kümelerini filtreleme
Hastanelerin yeni hastaları sisteme alırken kullandığı şirketine ait sağlık sohbet botu için bir eğitim ve değerlendirme hattı (pipeline) kuruyorsun.
Görevin, tıbbi soruları yanıtlama becerisi açısından bir LLM’i değerlendirmek için MedQuad-MedicalQnADataset veri kümesini yükleyen bir hat oluşturmak. dataset_name içinde belirtilen veri kümesinin train bölümünden yalnızca ilk 500 örneği değerlendirme kümesi olarak dahil ederek veri kümesini ds değişkenine yüklemen isteniyor.
Bu egzersiz, kursun bir parçasıdır
Llama 3 ile İnce Ayar (Fine-Tuning)
Egzersiz talimatları
- Gerekli fonksiyon ve sınıfları
datasetspaketinden içe aktar. - Veri kümesini
dsdeğişkenine yükle. dataset_nameiçinde belirtilen veri kümesinintrainbölümünden ilk 500 örneği değerlendirme kümesi olacak şekildedsüzerinde gerekli işlemleri yap.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Load neccesary imports from library
from datasets import ____, ____
# Load the training split of the dataset
ds = load_dataset(dataset_name, split=____)
# Filter for the first 500 samples of the dataset
filtered_ds = ____