Düşük güven
Bu egzersizde, bir ödül modeliyle çalışarak giriş metnini ne kadar güvenle sınıflandırdığını değerlendirecek ve güvenilir olmayan tahminleri filtreleyeceksin. Amaç, modelin tahmin üretme becerisini değerlendirmek ve yalnızca yüksek güvene sahip tahminlerin geçerli sayılmasını sağlamak için bir güven eşiği uygulamak.
Her bir geri bildirim metni için olasılık dağılımları (prob_dists) ve geri bildirim metinleri (texts) değişkenleri ile least_confidence() fonksiyonu yüklendi.
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırEgzersiz talimatları
- Güven değeri verilen bir eşikten düşük olan olasılık dağılımlarının indekslerini filtreleyen fonksiyonu tanımla.
- Eşiği değiştirmeden (
0.5), olasılık dağılımlarını fonksiyona geçirerek geri bildirim yorumlarının indekslerini al.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
filtered_indices = [i for i, ____ in enumerate(____) ____]
return filtered_indices
# Find the indices
filtered_indices = ____
high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)