Bewertungsmetriken definieren
Du entwickelst einen Echtzeit-Sprachübersetzungsdienst in einer Videokonferenz-App. Um das Training zu überwachen, definierst du Bewertungsmetriken für Accuracy und F1-Score, die die Gesamtleistung des Modells messen.
Die Bibliotheken evaluate und numpy (np) sind bereits importiert.
Diese Übung ist Teil des Kurses
<Kurs>Effizientes KI-Modelltraining mit PyTorch</Kurs>Übungsanweisungen
- Lade den
f1-Score mit derevaluate-Bibliothek;accuracywurde bereits für dich geladen. - Extrahiere
logitsundlabels, indem dueval_predictionsin zwei Variablen entpackst. - Wandle
logitsinpredictionsum. - Berechne den
f1-Score basierend auf denpredictionsundlabels.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def compute_metrics(eval_predictions):
load_accuracy = evaluate.load("accuracy")
# Load the F1 score
load_f1 = evaluate.load("____")
# Extract logits and labels from eval_predictions
logits, ____ = eval_predictions
# Convert logits to predictions
predictions = np.____(logits, axis=-1)
accuracy = load_accuracy.compute(predictions=predictions, references=labels)["accuracy"]
# Compute the F1 score
f1 = ____.____(predictions=predictions, references=labels)["f1"]
return {"accuracy": accuracy, "f1": f1}