Interpretare le curve
Stai valutando un modello usando curve di apprendimento e metriche di performance su più epoche di training. Che cosa indica una curva della perdita KL relativamente stabile riguardo al tuo modello?
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio