1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý dữ liệu với pandas

Connected

Exercise

Tổng hợp hiệu quả

Mặc dù pandas và NumPy có rất nhiều hàm, đôi khi bạn sẽ cần một hàm khác để tóm tắt dữ liệu.

Phương thức .agg() cho phép bạn áp dụng các hàm tùy chỉnh của riêng mình lên một DataFrame, cũng như áp dụng hàm lên nhiều cột của DataFrame cùng lúc, giúp việc tổng hợp trở nên cực kỳ hiệu quả. Ví dụ,

df['column'].agg(function)

Trong hàm tùy chỉnh cho bài tập này, "IQR" là viết tắt của khoảng tứ phân vị (inter-quartile range), được tính bằng phân vị thứ 75 trừ phân vị thứ 25. Đây là một lựa chọn thay thế cho độ lệch chuẩn, hữu ích khi dữ liệu của bạn có các giá trị ngoại lai.

sales đã được cung cấp và pandas đã được nạp với bí danh pd.

Instructions 1/3

undefined XP
  • 1
    • Dùng hàm tùy chỉnh iqr đã được định nghĩa sẵn cùng với .agg() để in ra IQR của cột temperature_c trong sales.
  • 2
    • Cập nhật phần chọn cột để dùng hàm tùy chỉnh iqr với .agg() nhằm in ra IQR của temperature_c, fuel_price_usd_per_l, và unemployment, theo đúng thứ tự đó.
  • 3
    • Cập nhật các hàm tổng hợp được gọi bởi .agg(): bao gồm iqr và "median" theo đúng thứ tự đó.