1. Nauka
  2. /
  3. Kursy
  4. /
  5. Fine-Tuning z Llama 3

Connected

ćwiczenie

Filtrowanie zbiorów danych do ewaluacji

Budujesz potok treningowy i ewaluacyjny dla firmowego chatbota medycznego, wykorzystywanego przez szpitale podczas rejestracji nowych pacjentów.

Twoim zadaniem jest stworzenie potoku do wczytania zbioru MedQuad-MedicalQnADataset w celu ewaluacji modelu językowego pod kątem umiejętności odpowiadania na pytania medyczne. Wczytaj zbiór danych do zmiennej ds i uwzględnij wyłącznie pierwsze 500 próbek z podziału train zbioru zapisanego w dataset_name jako zestaw ewaluacyjny.

Instrukcje

100 XP
  • Zaimportuj niezbędne funkcje i klasy z biblioteki datasets.
  • Wczytaj zbiór danych do zmiennej ds.
  • Zmodyfikuj ds tak, aby zawierał pierwsze 500 próbek z podziału train zbioru zapisanego w dataset_name – będzie to twój zestaw ewaluacyjny.