Capire confronto e rating nell'RLHF
Ora tocca a te. Immagina di progettare un assistente AI e di dover capire la soddisfazione degli utenti. Stai valutando se raccogliere feedback basati sul confronto oppure, in alternativa, valutazioni numeriche. Ma quali sono le differenze tra i due approcci? Ogni metodo ha le sue caratteristiche e scegliere quello giusto può influire molto sul successo del tuo prodotto.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio