Valutare l'RLHF con metriche
Stai addestrando un modello usando il reinforcement learning con feedback umano (RLHF) e devi valutarne le prestazioni con metriche appropriate.
Quale delle seguenti è più adatta per valutare automaticamente un'attività di riassunto?
Puoi visualizzare i dati nella console per aiutarti a decidere quali metriche sono più adatte al compito. I dati da valutare sono già caricati in un DataFrame chiamato df_evaluation.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio