Inizia subitoInizia gratis

Estrazione dei prompt

Stai lavorando con l’insieme di dati hendrydong/rlhf_helpful_eval, che contiene testo conversazionale tra un utente (Human) e un assistente (Assistant). Il tuo obiettivo è pulire il testo, preparando un prompt pulito in cui compaia solo il testo rilevante, senza schemi o tag specifici.

Scegli l’opzione che useresti per pulire l’insieme di dati ed estrarre i prompt. Puoi vedere un esempio di com’è fatto l’insieme di dati eseguendo il seguente codice nella console:

evaluation_data.iloc[range(1)]['text'][0]

Questo esercizio fa parte del corso

Reinforcement Learning from Human Feedback (RLHF)

Visualizza corso

esercizio interattivo pratico

Trasforma la teoria in pratica con uno dei nostri esercizi interattivi

Inizia esercizio