Aan de slagGa gratis aan de slag

Curves interpreteren

Je evalueert een model met leercurves en prestatielocaties over meerdere trainingsepoches. Wat geeft een relatief stabiele KL-verliescurve aan over je model?

Deze oefening maakt deel uit van de cursus

Reinforcement Learning from Human Feedback (RLHF)

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen