Kurven interpretieren
Du bewertest ein Modell anhand von Lernkurven und Leistungsmetriken über mehrere Trainingsepochen. Was zeigt eine relativ stabile KL-Loss-Kurve über dein Modell an?
Diese Übung ist Teil des Kurses
<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten