1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nâng cấp trực quan hóa dữ liệu của bạn với Python

Connected

Bài tập

Chú thích khoảng tin cậy

Công việc khoa học dữ liệu của bạn với dữ liệu ô nhiễm đã trở nên nổi tiếng, và giờ bạn đang cân nhắc các lời mời làm việc ở Cincinnati, Ohio và Indianapolis, Indiana. Bạn muốn xem liệu mức SO2 có khác biệt đáng kể giữa hai thành phố hay không, và cụ thể hơn là thành phố nào có mức thấp hơn. Để kiểm tra điều này, bạn quyết định xem xét chênh lệch giá trị SO2 giữa hai thành phố (giá trị của Indianapolis - Cincinnati) theo nhiều năm (được cung cấp trong diffs_by_year).

Thay vì chỉ hiển thị p-value cho sự khác biệt có ý nghĩa thống kê giữa hai thành phố, bạn quyết định xem các khoảng tin cậy 95% (các cột lower và upper) của các chênh lệch. Cách này cho phép bạn thấy được độ lớn của chênh lệch cùng với bất kỳ xu hướng nào theo thời gian.

Hướng dẫn

100 XP
  • Cung cấp giới hạn bắt đầu và kết thúc (các cột lower và upper) cho các khoảng tin cậy của bạn vào plt.hlines().
  • Đặt độ dày khoảng bằng 5.
  • Vẽ một đường thẳng đứng biểu diễn chênh lệch 0 bằng plt.axvline().
  • Tô màu đường giả thuyết rỗng là 'orangered' để nó nổi bật hơn.