1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Fine-Tuning với Llama 3

Connected

Bài tập

Lọc tập dữ liệu để đánh giá

Bạn đang xây dựng một pipeline huấn luyện và đánh giá cho chatbot chăm sóc sức khỏe của công ty, được các bệnh viện dùng để tiếp nhận bệnh nhân mới.

Nhiệm vụ của bạn là tạo một pipeline để tải MedQuad-MedicalQnADataset nhằm đánh giá một LLM về khả năng trả lời câu hỏi y khoa. Bạn được yêu cầu tải tập dữ liệu vào biến ds, và chỉ bao gồm 500 mẫu đầu tiên của phần train của tập dữ liệu được lưu trong dataset_name làm tập đánh giá.

Hướng dẫn

100 XP
  • Import các hàm và lớp cần thiết từ datasets.
  • Tải tập dữ liệu vào biến ds.
  • Xử lý ds để chỉ bao gồm 500 mẫu đầu tiên của phần train của tập dữ liệu được lưu trong dataset_name làm tập đánh giá.