MulaiMulai sekarang secara gratis

Mengevaluasi RLHF dengan metrik

Anda sedang melatih sebuah model menggunakan reinforcement learning dengan umpan balik manusia (RLHF) dan perlu mengevaluasi kinerjanya menggunakan metrik yang sesuai.

Manakah dari berikut ini yang paling tepat untuk mengevaluasi tugas peringkasan menggunakan metrik otomatis?

Anda dapat memvisualisasikan data menggunakan konsol untuk membantu menentukan metrik mana yang paling sesuai untuk tugas tersebut. Data yang perlu Anda evaluasi telah dimuat sebelumnya sebagai DataFrame bernama df_evaluation.

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga