MulaiMulai sekarang secara gratis

Keyakinan rendah

Dalam latihan ini, Anda akan bekerja dengan model reward untuk menilai seberapa yakin model tersebut mengklasifikasikan teks masukan dan menyaring prediksi yang kurang andal. Tujuannya adalah mengevaluasi kemampuan model dalam menghasilkan prediksi dan menerapkan ambang keyakinan agar hanya prediksi dengan keyakinan tinggi yang dianggap valid.

Distribusi probabilitas untuk setiap teks umpan balik (prob_dists) dan variabel teks umpan balik (texts), serta fungsi least_confidence() telah dimuat.

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Petunjuk latihan

  • Definisikan fungsi untuk menyaring indeks distribusi probabilitas yang tingkat keyakinannya berada di bawah ambang batas tertentu.
  • Dapatkan indeks komentar umpan balik dengan mengumpankan distribusi probabilitas ke fungsi tersebut, biarkan ambang batas tidak berubah (0.5).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
    filtered_indices = [i for i, ____ in enumerate(____) ____]
    return filtered_indices

# Find the indices
filtered_indices = ____

high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)
Edit dan Jalankan Kode