Eğrileri yorumlama
Bir modeli, birkaç eğitim dönemine yayılmış öğrenme eğrileri ve performans metrikleriyle değerlendiriyorsun. Nispeten kararlı bir KL kaybı eğrisi modelin hakkında neyi gösterir?
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat