Mengekstrak prompt
Anda bekerja dengan himpunan data hendrydong/rlhf_helpful_eval, yang berisi teks percakapan antara pengguna (Human) dan asisten (Assistant). Tujuan Anda adalah membersihkan teks untuk menyiapkan prompt yang bersih, sehingga hanya teks yang relevan yang muncul tanpa pola atau tag tertentu.
Pilih opsi yang akan Anda gunakan untuk membersihkan himpunan data guna mengekstrak prompt. Anda dapat melihat cuplikan tampilan himpunan data dengan menjalankan kode berikut di konsol:
evaluation_data.iloc[range(1)]['text'][0]
Latihan ini merupakan bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan