LoslegenKostenlos loslegen

RLHF mit Metriken bewerten

Du trainierst ein Modell mit Reinforcement Learning mit menschlichem Feedback (RLHF) und musst seine Leistung mit geeigneten Metriken bewerten.

Welche der folgenden Optionen eignet sich am besten, um eine Zusammenfassungsaufgabe mithilfe automatisierter Metriken zu evaluieren?

Du kannst die Daten in der Konsole visualisieren, um zu entscheiden, welche Metrik sich am besten für die Aufgabe eignet. Die zu bewertenden Daten wurden als DataFrame namens df_evaluation vorab geladen.

Diese Übung ist Teil des Kurses

Reinforcement Learning aus menschlichem Feedback (RLHF)

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten