1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nâng cấp trực quan hóa dữ liệu của bạn với Python

Connected

Bài tập

Mức độ phổ biến của hàng hóa theo bang

Bộ dữ liệu chợ nông sản có các cột tương ứng với 28 loại hàng hóa khác nhau và việc chúng có được bán ở chợ đó hay không. Bạn muốn xem liệu có câu chuyện thú vị nào về việc bạn có khả năng tìm thấy một mặt hàng nhất định ở các chợ của từng bang hay không. Để trả lời câu hỏi này, bạn gom dữ liệu về ba cột:

  • state - tên bang
  • good - mặt hàng quan tâm
  • prop_selling - tỷ lệ các chợ trong bang đó có bán mặt hàng đó

Để nhanh chóng xem có xuất hiện mẫu hình nào không, bạn chọn một tập con các mặt hàng mà bạn thấy thú vị và quyết định vẽ một biểu đồ scatter bằng chữ đơn giản: mặt hàng trên trục x và tỷ lệ các chợ của một bang bán mặt hàng đó trên trục y.

Hướng dẫn

100 XP
  • Lọc goods_by_state theo các mặt hàng mong muốn được liệt kê trong to_plot.

  • Ẩn các điểm scatter bằng cách đặt kích thước của chúng về rỗng.

    • Lưu ý rằng trong sns.scatterplot(), size dùng để ánh xạ giá trị từ một cột sang thang kích thước, còn s dùng để đặt một kích thước cố định cho mọi điểm.
  • Căn giữa văn bản để nó nằm đúng tại vị trí trục x của mặt hàng.