LoslegenKostenlos starten

RLHF mit Metriken bewerten

Du trainierst ein Modell mit Reinforcement Learning mit menschlichem Feedback (RLHF) und musst seine Leistung mit geeigneten Metriken bewerten.

Welche der folgenden Optionen eignet sich am besten, um eine Zusammenfassungsaufgabe mithilfe automatisierter Metriken zu evaluieren?

Du kannst die Daten in der Konsole visualisieren, um zu entscheiden, welche Metrik sich am besten für die Aufgabe eignet. Die zu bewertenden Daten wurden als DataFrame namens df_evaluation vorab geladen.

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten