Mulai sekarangMulai gratis

Menafsirkan kurva

Anda sedang mengevaluasi sebuah model menggunakan kurva pembelajaran dan metrik kinerja selama beberapa epoch pelatihan. Apa yang ditunjukkan oleh kurva kerugian KL yang relatif stabil tentang model Anda?

Latihan ini merupakan bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Mulai latihan