Valutare l'RLHF con metriche
Stai addestrando un modello usando il reinforcement learning con feedback umano (RLHF) e devi valutarne le prestazioni con metriche appropriate.
Quale delle seguenti è più adatta per valutare automaticamente un'attività di riassunto?
Puoi visualizzare i dati nella console per aiutarti a decidere quali metriche sono più adatte al compito. I dati da valutare sono già caricati in un DataFrame chiamato df_evaluation.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
esercizio interattivo pratico
Trasforma la teoria in pratica con uno dei nostri esercizi interattivi
Inizia esercizio