IniziaInizia gratis

Bassa confidenza

In questo esercizio lavorerai con un modello di ricompensa per valutare con quanta sicurezza classifica il testo in input e per filtrare le predizioni che non sono affidabili. L'obiettivo è valutare la capacità del modello di generare predizioni e applicare una soglia di confidenza per assicurare che solo le predizioni ad alta confidenza vengano considerate valide.

Le distribuzioni di probabilità per ciascun testo di feedback (prob_dists) e la variabile dei testi di feedback (texts), oltre alla funzione least_confidence(), sono già state caricate.

Questo esercizio fa parte del corso

Reinforcement Learning from Human Feedback (RLHF)

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci la funzione per filtrare gli indici delle distribuzioni di probabilità per le quali la confidenza è al di sotto di una data soglia.
  • Ottieni gli indici dei commenti di feedback passando le distribuzioni di probabilità alla funzione, lasciando invariata la soglia (0.5).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
    filtered_indices = [i for i, ____ in enumerate(____) ____]
    return filtered_indices

# Find the indices
filtered_indices = ____

high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)
Modifica ed esegui il codice