RLHF'de karşılaştırma ve derecelendirmeyi anlama
Şimdi sıra sende. Bir yapay zekâ asistanı tasarladığını ve kullanıcı memnuniyetini anlaman gerektiğini düşün. Karşılaştırma temelli geri bildirim toplamayı ya da alternatif olarak derecelendirmeleri değerlendiriyorsun. Peki ikisi arasındaki farklar neler? Her yöntemin kendine özgü özellikleri var ve doğru olanı seçmek ürününün başarısını ciddi şekilde etkileyebilir.
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat