Inizia subitoInizia gratis

Interpretare le curve

Stai valutando un modello usando curve di apprendimento e metriche di performance su più epoche di training. Che cosa indica una curva della perdita KL relativamente stabile riguardo al tuo modello?

Questo esercizio fa parte del corso

Reinforcement Learning from Human Feedback (RLHF)

Visualizza corso

esercizio interattivo pratico

Trasforma la teoria in pratica con uno dei nostri esercizi interattivi

Inizia esercizio