BaşlayınÜcretsiz başlayın

Değerlendirme için veri kümelerini filtreleme

Hastanelerin yeni hastaları sisteme alırken kullandığı şirketine ait sağlık sohbet botu için bir eğitim ve değerlendirme hattı (pipeline) kuruyorsun.

Görevin, tıbbi soruları yanıtlama becerisi açısından bir LLM’i değerlendirmek için MedQuad-MedicalQnADataset veri kümesini yükleyen bir hat oluşturmak. dataset_name içinde belirtilen veri kümesinin train bölümünden yalnızca ilk 500 örneği değerlendirme kümesi olarak dahil ederek veri kümesini ds değişkenine yüklemen isteniyor.

Bu egzersiz, kursun bir parçasıdır

Llama 3 ile İnce Ayar (Fine-Tuning)

Kursa Göz Atın

Egzersiz talimatları

  • Gerekli fonksiyon ve sınıfları datasets paketinden içe aktar.
  • Veri kümesini ds değişkenine yükle.
  • dataset_name içinde belirtilen veri kümesinin train bölümünden ilk 500 örneği değerlendirme kümesi olacak şekilde ds üzerinde gerekli işlemleri yap.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Load neccesary imports from library
from datasets import ____, ____

# Load the training split of the dataset
ds = load_dataset(dataset_name, split=____)

# Filter for the first 500 samples of the dataset
filtered_ds = ____
Kodu Düzenle ve Çalıştır