BaşlayınÜcretsiz Başlayın

Düşük güven

Bu egzersizde, bir ödül modeliyle çalışarak giriş metnini ne kadar güvenle sınıflandırdığını değerlendirecek ve güvenilir olmayan tahminleri filtreleyeceksin. Amaç, modelin tahmin üretme becerisini değerlendirmek ve yalnızca yüksek güvene sahip tahminlerin geçerli sayılmasını sağlamak için bir güven eşiği uygulamak.

Her bir geri bildirim metni için olasılık dağılımları (prob_dists) ve geri bildirim metinleri (texts) değişkenleri ile least_confidence() fonksiyonu yüklendi.

Bu egzersiz

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Güven değeri verilen bir eşikten düşük olan olasılık dağılımlarının indekslerini filtreleyen fonksiyonu tanımla.
  • Eşiği değiştirmeden (0.5), olasılık dağılımlarını fonksiyona geçirerek geri bildirim yorumlarının indekslerini al.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
    filtered_indices = [i for i, ____ in enumerate(____) ____]
    return filtered_indices

# Find the indices
filtered_indices = ____

high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)
Kodu Düzenle ve Çalıştır