Mengekstrak prompt
Anda bekerja dengan himpunan data hendrydong/rlhf_helpful_eval, yang berisi teks percakapan antara pengguna (Human) dan asisten (Assistant). Tujuan Anda adalah membersihkan teks untuk menyiapkan prompt yang bersih, sehingga hanya teks yang relevan yang muncul tanpa pola atau tag tertentu.
Pilih opsi yang akan Anda gunakan untuk membersihkan himpunan data guna mengekstrak prompt. Anda dapat melihat cuplikan tampilan himpunan data dengan menjalankan kode berikut di konsol:
evaluation_data.iloc[range(1)]['text'][0]
Latihan ini adalah bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga