1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với pandas

Connected

Bài tập

Tính toán trên pivot table

Pivot table chứa sẵn các thống kê tóm tắt, nhưng đó chỉ là bước khởi đầu để tìm ra điều gì đó có ý nghĩa. Thông thường bạn sẽ cần thực hiện thêm các phép tính trên chúng. Một thao tác phổ biến là tìm các hàng hoặc cột có giá trị cao nhất hoặc thấp nhất.

Nhắc lại từ Chương 1: bạn có thể dễ dàng trích lọc một Series hoặc DataFrame để tìm các hàng quan tâm bằng cách dùng điều kiện logic trong dấu ngoặc vuông. Ví dụ: series[series > value].

pandas đã được nạp với tên pd và DataFrame temp_by_country_city_vs_year đã có sẵn. .head() của DataFrame này được hiển thị bên dưới, chỉ với một vài cột năm:

country city 2000 2001 2002 … 2013
Afghanistan Kabul 15.823 15.848 15.715 … 16.206
Angola Luanda 24.410 24.427 24.791 … 24.554
Australia Melbourne 14.320 14.180 14.076 … 14.742
Sydney 17.567 17.854 17.734 … 18.090
Bangladesh span translate="no">Dhaka 25.905 25.931 26.095 … 26.587

Hướng dẫn

100 XP
  • Tính nhiệt độ trung bình cho mỗi năm và gán vào mean_temp_by_year.
  • Lọc mean_temp_by_year để lấy năm có nhiệt độ trung bình cao nhất.
  • Tính nhiệt độ trung bình cho mỗi thành phố (theo chiều cột), gán vào mean_temp_by_city.
  • Lọc mean_temp_by_city để lấy thành phố có nhiệt độ trung bình thấp nhất.