1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với pandas

Connected

Bài tập

Cắt lát chuỗi thời gian

Cắt lát đặc biệt hữu ích cho chuỗi thời gian vì bạn thường cần lọc dữ liệu trong một khoảng ngày. Thêm cột date vào chỉ mục, rồi dùng .loc[] để trích lọc. Điều quan trọng cần nhớ là giữ ngày ở định dạng ISO 8601, tức "yyyy-mm-dd" cho năm-tháng-ngày, "yyyy-mm" cho năm-tháng và "yyyy" cho năm.

Nhắc lại từ Chương 1 rằng bạn có thể kết hợp nhiều điều kiện Boolean bằng các toán tử logic như &. Để làm điều đó trong một dòng mã, bạn cần thêm dấu ngoặc () quanh mỗi điều kiện.

pandas đã được nạp là pd và temperatures, chưa có chỉ mục, đã sẵn sàng.

Hướng dẫn

100 XP
  • Dùng các điều kiện Boolean, không dùng .isin() hay .loc[], và dùng đầy đủ ngày "yyyy-mm-dd", để trích lọc temperatures cho các hàng có cột date thuộc năm 2010 và 2011, rồi in kết quả.
  • Đặt chỉ mục của temperatures thành cột date và sắp xếp nó.
  • Dùng .loc[] để trích lọc temperatures_ind cho các hàng thuộc năm 2010 và 2011.
  • Dùng .loc[] để trích lọc temperatures_ind cho các hàng từ August 2010 đến February 2011.