Metriklerle RLHF değerlendirme
İnsan geri bildirimiyle pekiştirmeli öğrenme (RLHF) kullanarak bir model eğitiyorsun ve performansını uygun metriklerle değerlendirmen gerekiyor.
Aşağıdakilerden hangisi, otomatik metrikler kullanarak bir özetleme görevini değerlendirmek için en uygun olur?
Hangi metriklerin bu görev için daha uygun olduğuna karar vermene yardımcı olması için verileri konsolda görselleştirebilirsin. Değerlendirmen gereken veriler df_evaluation adlı bir DataFrame olarak önceden yüklendi.
Bu egzersiz, kursun bir parçasıdır
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
Uygulamalı etkileşimli egzersiz
Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle
Egzersize başla