BaşlayınÜcretsiz başlayın

Düşük güven

Bu egzersizde, bir ödül modeliyle çalışarak giriş metnini ne kadar güvenle sınıflandırdığını değerlendirecek ve güvenilir olmayan tahminleri filtreleyeceksin. Amaç, modelin tahmin üretme becerisini değerlendirmek ve yalnızca yüksek güvene sahip tahminlerin geçerli sayılmasını sağlamak için bir güven eşiği uygulamak.

Her bir geri bildirim metni için olasılık dağılımları (prob_dists) ve geri bildirim metinleri (texts) değişkenleri ile least_confidence() fonksiyonu yüklendi.

Bu egzersiz, kursun bir parçasıdır

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

Kursa Göz Atın

Egzersiz talimatları

  • Güven değeri verilen bir eşikten düşük olan olasılık dağılımlarının indekslerini filtreleyen fonksiyonu tanımla.
  • Eşiği değiştirmeden (0.5), olasılık dağılımlarını fonksiyona geçirerek geri bildirim yorumlarının indekslerini al.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
    filtered_indices = [i for i, ____ in enumerate(____) ____]
    return filtered_indices

# Find the indices
filtered_indices = ____

high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)
Kodu Düzenle ve Çalıştır