1. Aprender
  2. /
  3. Cursos
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Exercício

Phân loại văn bản sinh ra cho RLHF

Giờ bạn muốn phân loại các bài đánh giá đã được sinh ra. Một cách để đánh giá đầu ra là đo mức độ tích cực của các bài đánh giá này bằng bộ phân loại lvwerra/distilbert-imdb, mà bạn cũng có thể khởi tạo bằng Hugging Face pipelines.

Thư viện pipeline đã được nhập sẵn từ transformers. Mô hình lvwerra/distilbert-imdb đã được nạp sẵn là model. Tokenizer đã được nạp sẵn là tokenizer.

Instruções

100 XP
  • Dùng hàm pipeline để tạo một pipeline phân tích cảm xúc với mô hình đã cho.
  • Phân loại cảm xúc của bài đánh giá được cung cấp.