MulaiMulai sekarang secara gratis

Mengekstrak prompt

Anda bekerja dengan himpunan data hendrydong/rlhf_helpful_eval, yang berisi teks percakapan antara pengguna (Human) dan asisten (Assistant). Tujuan Anda adalah membersihkan teks untuk menyiapkan prompt yang bersih, sehingga hanya teks yang relevan yang muncul tanpa pola atau tag tertentu.

Pilih opsi yang akan Anda gunakan untuk membersihkan himpunan data guna mengekstrak prompt. Anda dapat melihat cuplikan tampilan himpunan data dengan menjalankan kode berikut di konsol:

evaluation_data.iloc[range(1)]['text'][0]

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga