IniziaInizia gratis

Estrazione dei prompt

Stai lavorando con l’insieme di dati hendrydong/rlhf_helpful_eval, che contiene testo conversazionale tra un utente (Human) e un assistente (Assistant). Il tuo obiettivo è pulire il testo, preparando un prompt pulito in cui compaia solo il testo rilevante, senza schemi o tag specifici.

Scegli l’opzione che useresti per pulire l’insieme di dati ed estrarre i prompt. Puoi vedere un esempio di com’è fatto l’insieme di dati eseguendo il seguente codice nella console:

evaluation_data.iloc[range(1)]['text'][0]

Questo esercizio fa parte del corso

Reinforcement Learning from Human Feedback (RLHF)

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio