1. Learn
  2. /
  3. Cursuri
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

exercițiu

Klasyfikowanie wygenerowanego tekstu na potrzeby RLHF

Teraz chcesz skategoryzować wygenerowane recenzje. Jednym ze sposobów oceny wyników jest zmierzenie pozytywności wygenerowanych recenzji za pomocą klasyfikatora lvwerra/distilbert-imdb, który możesz również zainicjować za pomocą potoków Hugging Face.

Biblioteka pipeline została wcześniej zaimportowana z transformers. Model lvwerra/distilbert-imdb został wstępnie załadowany jako model. Tokenizer został wstępnie załadowany jako tokenizer.

Instrucțiuni

100 XP
  • Użyj funkcji pipeline, aby utworzyć potok analizy sentymentu z danym modelem.
  • Sklasyfikuj sentyment podanej recenzji.