Mulai sekarangMulai gratis

Mengekstrak prompt

Anda bekerja dengan himpunan data hendrydong/rlhf_helpful_eval, yang berisi teks percakapan antara pengguna (Human) dan asisten (Assistant). Tujuan Anda adalah membersihkan teks untuk menyiapkan prompt yang bersih, sehingga hanya teks yang relevan yang muncul tanpa pola atau tag tertentu.

Pilih opsi yang akan Anda gunakan untuk membersihkan himpunan data guna mengekstrak prompt. Anda dapat melihat cuplikan tampilan himpunan data dengan menjalankan kode berikut di konsol:

evaluation_data.iloc[range(1)]['text'][0]

Latihan ini merupakan bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Mulai latihan