Classificare il testo generato per RLHF
Ora vuoi categorizzare le recensioni generate. Un modo per valutare l'output è misurare la positività delle recensioni generate usando il classificatore lvwerra/distilbert-imdb, che puoi istanziare anche tramite le pipeline di Hugging Face.
La libreria pipeline è già stata importata da transformers. Il modello lvwerra/distilbert-imdb è stato precaricato come model. Il tokenizer è stato precaricato come tokenizer.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Istruzioni dell'esercizio
- Usa la funzione
pipelineper creare una pipeline di sentiment-analysis con il modello. - Classifica il sentiment della recensione fornita.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a sentiment analysis pipeline
sentiment_analyzer = pipeline(____, model=____, tokenizer=____)
review_text = "Surprisingly, the film is a very good one"
# Classify the sentiment of the review
sentiment = sentiment_analyzer(____)
print(f"Sentiment Analysis Result: {sentiment}")