1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Viết mã hiệu quả với pandas

Connected

Bài tập

Chọn hàng: loc[] vs iloc[]

Một phần quan trọng khi làm việc với DataFrame là định vị các mục (entry) cụ thể trong dữ liệu. Bạn có thể xác định các hàng theo hai cách:

  • Theo một giá trị cụ thể của cột (feature).
  • Theo chỉ số (index) của các hàng. Trong bài này, chúng ta sẽ tập trung vào cách thứ hai.

Nếu bạn đã từng dùng pandas, bạn sẽ quen với hai bộ lập chỉ mục .loc và .iloc, lần lượt là 'location' và 'index location'. Trong hầu hết trường hợp, chỉ số sẽ trùng với vị trí của từng hàng trong DataFrame (ví dụ: hàng có chỉ số 13 sẽ là mục thứ 14).

Mặc dù có thể dùng cả hai hàm để làm cùng một việc, chúng ta quan tâm đến hàm nào hiệu quả hơn về mặt tốc độ.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Lưu chỉ số của 1000 hàng đầu tiên vào row_nums.
  • Dùng bộ lập chỉ mục .loc[] để chọn 1000 hàng đầu tiên của poker_hands, và ghi lại thời gian trước và sau thao tác đó.
  • In ra thời gian cần để chọn các hàng.