1. 学ぶ
  2. /
  3. コース
  4. /
  5. Làm việc với Hugging Face

Connected

演習

Thao tác với datasets

Sẽ có khá nhiều trường hợp bạn cần thao tác với một dataset trước khi dùng nó cho một tác vụ ML. Hai thao tác phổ biến là lọc (filtering) và chọn/lấy lát cắt (selecting/slicing). Do kích thước các dataset này rất lớn, Hugging Face tận dụng định dạng tệp arrow.

Điều này có nghĩa là cách thao tác sẽ hơi khác với những gì bạn quen dùng. May mắn là đã có sẵn các phương thức để hỗ trợ!

Dataset đã được nạp sẵn vào biến wikipedia.

指示1 / 2

undefined XP
    1
    2
  • Lọc dataset để lấy các hàng có cụm "football" trong cột text và lưu vào filtered.
  • Chọn một ví dụ duy nhất từ dataset đã lọc và lưu vào example.