RLHF mit Metriken bewerten
Du trainierst ein Modell mit Reinforcement Learning mit menschlichem Feedback (RLHF) und musst seine Leistung mit geeigneten Metriken bewerten.
Welche der folgenden Optionen eignet sich am besten, um eine Zusammenfassungsaufgabe mithilfe automatisierter Metriken zu evaluieren?
Du kannst die Daten in der Konsole visualisieren, um zu entscheiden, welche Metrik sich am besten für die Aufgabe eignet. Die zu bewertenden Daten wurden als DataFrame namens df_evaluation vorab geladen.
Diese Übung ist Teil des Kurses
Reinforcement Learning aus menschlichem Feedback (RLHF)
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten