1. Learn
  2. /
  3. Courses
  4. /
  5. Nâng cấp trực quan hóa dữ liệu của bạn với Python

Connected

Exercise

Xử lý khi có quá nhiều danh mục

Đôi khi bạn bị hạn chế không gian hình vẽ nhưng cần hiển thị rất nhiều dữ liệu cùng lúc. Ở đây, bạn muốn hiển thị quỹ đạo cả năm của mọi chất ô nhiễm cho mọi thành phố trong bộ dữ liệu pollution. Mỗi quỹ đạo chất ô nhiễm sẽ được vẽ dưới dạng một đường với giá trị y tương ứng với số độ lệch chuẩn so với trung bình của năm. Điều này có nghĩa là bạn sẽ có rất nhiều đường trên biểu đồ cùng lúc — nhiều hơn mức bạn có thể phân biệt rõ ràng bằng màu sắc.

Để xử lý, bạn quyết định làm nổi bật một tập con nhỏ các tổ hợp thành phố–chất ô nhiễm (wanted_combos). Tập con này là quan trọng nhất với bạn, còn các quỹ đạo khác sẽ cung cấp bối cảnh hữu ích để so sánh. Để tập trung sự chú ý, bạn sẽ đặt tất cả các đường không được làm nổi bật về cùng một màu “other”.

Instructions

100 XP
  • Sửa biểu thức list comprehension để tách ra các tổ hợp thành phố và chất ô nhiễm (wanted_combos) như mong muốn.
  • Yêu cầu biểu đồ đường tô màu các đường theo cột color_cats vừa tạo trong DataFrame của bạn.
  • Dùng tham số units để xác định cách nối các điểm dữ liệu thành từng đường, tức là lấy từ cột nào.
  • Tắt việc gộp (binning) các điểm bằng tham số estimator.