Trích xuất prompt

Bạn đang làm việc với tập dữ liệu hendrydong/rlhf_helpful_eval, chứa hội thoại giữa người dùng (Human) và trợ lý (Assistant). Mục tiêu của bạn là làm sạch văn bản, tạo một prompt sạch nơi chỉ còn lại nội dung liên quan, không có mẫu định dạng hay thẻ đặc biệt.

Hãy chọn cách bạn sẽ dùng để làm sạch tập dữ liệu nhằm trích xuất các prompt. Bạn có thể xem một phần nhỏ dữ liệu bằng cách chạy đoạn mã sau trong console:

evaluation_data.iloc[range(1)]['text'][0]

Các phương án trả lời

Thêm {{Role: Assistant}} vào các prompt

Xóa tất cả ký tự xuống dòng

Chỉ trích xuất văn bản nằm giữa các thẻ ###Human: đầu tiên và ###Assistant:

Bài tập

Trích xuất prompt

Hướng dẫn

Các phương án trả lời

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Các phương án trả lời

Bài tập