1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

Fine-tuning pro klasifikaci recenzí

Projekt pokračuje a teď chceš klasifikovat recenze jako pozitivní, neutrální nebo negativní. K automatickému kategorizování recenzí použiješ fine-tuned model.

Třídy TrainingArguments a Trainer jsou již naimportované z transformers. Proměnné training_args, model a tokenized_datasets jsou také předem naimportované.

Pokyny

100 XP
  • Vytvoř trénovací a testovací datové sady pomocí podmnožin "train" a "test" z datasetu tokenized_datasets.
  • Inicializuj třídu tréneru.
  • Přidej do třídy argumenty trénování.