Mengevaluasi RLHF dengan metrik
Anda sedang melatih sebuah model menggunakan reinforcement learning dengan umpan balik manusia (RLHF) dan perlu mengevaluasi kinerjanya menggunakan metrik yang sesuai.
Manakah dari berikut ini yang paling tepat untuk mengevaluasi tugas peringkasan menggunakan metrik otomatis?
Anda dapat memvisualisasikan data menggunakan konsol untuk membantu menentukan metrik mana yang paling sesuai untuk tugas tersebut. Data yang perlu Anda evaluasi telah dimuat sebelumnya sebagai DataFrame bernama df_evaluation.
Latihan ini adalah bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga