Eğrileri yorumlama
Bir modeli, birkaç eğitim dönemine yayılmış öğrenme eğrileri ve performans metrikleriyle değerlendiriyorsun. Nispeten kararlı bir KL kaybı eğrisi modelin hakkında neyi gösterir?
Bu egzersiz, kursun bir parçasıdır
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
Uygulamalı etkileşimli egzersiz
Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle
Egzersize başla