1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

Klasifikace generovaného textu pro RLHF

Teď chceš kategorizovat vygenerované recenze. Jedním ze způsobů, jak vyhodnotit výstup, je měření pozitivity vygenerovaných recenzí pomocí klasifikátoru lvwerra/distilbert-imdb, který také můžeš vytvořit pomocí Hugging Face pipeline.

Knihovna pipeline je předem naimportována z transformers. Model lvwerra/distilbert-imdb je předem načten jako model. Tokenizer je předem načten jako tokenizer.

Pokyny

100 XP
  • Pomocí funkce pipeline vytvoř pipeline pro analýzu sentimentu s daným modelem.
  • Klasifikuj sentiment zadané recenze.