LoslegenKostenlos starten

Kurven interpretieren

Du bewertest ein Modell anhand von Lernkurven und Leistungsmetriken über mehrere Trainingsepochen. Was zeigt eine relativ stabile KL-Loss-Kurve über dein Modell an?

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten