Definisci le metriche di valutazione
Stai sviluppando un servizio di traduzione linguistica in tempo reale per un'applicazione di videoconferenza. Per monitorare l'addestramento, definirai le metriche di valutazione per accuracy e F1 score, che misurano le prestazioni complessive del modello.
Le librerie evaluate e numpy (np) sono già state importate.
Questo esercizio fa parte del corso
Efficient AI Model Training with PyTorch
Istruzioni dell'esercizio
- Carica l'
f1score usando la libreriaevaluate;accuracyè già stata caricata per te. - Estrai
logitselabelsdecomprimendoeval_predictionsin due variabili. - Converti
logitsinpredictions. - Calcola l'
f1score in base apredictionselabels.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def compute_metrics(eval_predictions):
load_accuracy = evaluate.load("accuracy")
# Load the F1 score
load_f1 = evaluate.load("____")
# Extract logits and labels from eval_predictions
logits, ____ = eval_predictions
# Convert logits to predictions
predictions = np.____(logits, axis=-1)
accuracy = load_accuracy.compute(predictions=predictions, references=labels)["accuracy"]
# Compute the F1 score
f1 = ____.____(predictions=predictions, references=labels)["f1"]
return {"accuracy": accuracy, "f1": f1}