Bassa confidenza
In questo esercizio lavorerai con un modello di ricompensa per valutare con quanta sicurezza classifica il testo in input e per filtrare le predizioni che non sono affidabili. L'obiettivo è valutare la capacità del modello di generare predizioni e applicare una soglia di confidenza per assicurare che solo le predizioni ad alta confidenza vengano considerate valide.
Le distribuzioni di probabilità per ciascun testo di feedback (prob_dists) e la variabile dei testi di feedback (texts), oltre alla funzione least_confidence(), sono già state caricate.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Istruzioni dell'esercizio
- Definisci la funzione per filtrare gli indici delle distribuzioni di probabilità per le quali la confidenza è al di sotto di una data soglia.
- Ottieni gli indici dei commenti di feedback passando le distribuzioni di probabilità alla funzione, lasciando invariata la soglia (
0.5).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define the filter function
def filter_low_confidence_predictions(prob_dists, threshold=0.5):
filtered_indices = [i for i, ____ in enumerate(____) ____]
return filtered_indices
# Find the indices
filtered_indices = ____
high_confidence_texts = [texts[i] for i in filtered_indices]
print("High-confidence texts:", high_confidence_texts)