Estrazione dei prompt
Stai lavorando con l’insieme di dati hendrydong/rlhf_helpful_eval, che contiene testo conversazionale tra un utente (Human) e un assistente (Assistant). Il tuo obiettivo è pulire il testo, preparando un prompt pulito in cui compaia solo il testo rilevante, senza schemi o tag specifici.
Scegli l’opzione che useresti per pulire l’insieme di dati ed estrarre i prompt. Puoi vedere un esempio di com’è fatto l’insieme di dati eseguendo il seguente codice nella console:
evaluation_data.iloc[range(1)]['text'][0]
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio