LoslegenKostenlos loslegen

Datensätze für die Evaluation filtern

Du baust eine Trainings- und Evaluations-Pipeline für den Gesundheits-Chatbot deines Unternehmens, der in Krankenhäusern zur Aufnahme neuer Patientinnen und Patienten eingesetzt wird.

Deine Aufgabe ist es, eine Pipeline zu erstellen, die MedQuad-MedicalQnADataset lädt, um ein LLM hinsichtlich seiner Fähigkeit zu evaluieren, medizinische Fragen zu beantworten. Du sollst den Datensatz in die Variable ds laden und nur die ersten 500 Beispiele des train-Splits des in dataset_name gespeicherten Datensatzes als dein Evaluations-Set aufnehmen.

Diese Übung ist Teil des Kurses

Feinabstimmung mit Llama 3

Kurs anzeigen

Anleitung zur Übung

  • Importiere die benötigten Funktionen und Klassen aus datasets.
  • Lade den Datensatz in die Variable ds.
  • Bearbeite ds, sodass die ersten 500 Beispiele des train-Splits des in dataset_name gespeicherten Datensatzes als dein Evaluations-Set enthalten sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load neccesary imports from library
from datasets import ____, ____

# Load the training split of the dataset
ds = load_dataset(dataset_name, split=____)

# Filter for the first 500 samples of the dataset
filtered_ds = ____
Code bearbeiten und ausführen