1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

ćwiczenie

Dostrajanie modelu do klasyfikacji recenzji

Projekt trwa – teraz chcesz klasyfikować recenzje jako pozytywne, neutralne lub negatywne. Użyjesz dostrojonego modelu, aby automatycznie kategoryzować recenzje.

Klasy TrainingArguments i Trainer zostały już zaimportowane z transformers. Zmienne training_args, model oraz tokenized_datasets są również wstępnie zaimportowane.

Instrukcje

100 XP
  • Utwórz zbiory treningowy i testowy, używając podzbiorów "train" i "test" ze zbioru danych tokenized_datasets.
  • Zainicjalizuj klasę trenera.
  • Dodaj argumenty trenowania do klasy.