BaşlayınÜcretsiz Başlayın

RLHF'de karşılaştırma ve derecelendirmeyi anlama

Şimdi sıra sende. Bir yapay zekâ asistanı tasarladığını ve kullanıcı memnuniyetini anlaman gerektiğini düşün. Karşılaştırma temelli geri bildirim toplamayı ya da alternatif olarak derecelendirmeleri değerlendiriyorsun. Peki ikisi arasındaki farklar neler? Her yöntemin kendine özgü özellikleri var ve doğru olanı seçmek ürününün başarısını ciddi şekilde etkileyebilir.

Bu egzersiz

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün

Egzersizi başlat