1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Dùng .melt() để định hình lại dữ liệu chính phủ

US Bureau of Labor Statistics (BLS) thường cung cấp chuỗi dữ liệu ở định dạng dễ đọc — có cột riêng cho từng tháng, và mỗi năm là một hàng khác nhau. Đáng tiếc, định dạng rộng này khiến việc trực quan hóa dữ liệu theo thời gian trở nên khó khăn. Trong bài tập này, bạn sẽ định hình lại một bảng dữ liệu tỷ lệ thất nghiệp của Mỹ từ BLS sang dạng có thể vẽ được bằng .melt(). Bạn sẽ cần thêm một cột ngày vào bảng và sắp xếp theo cột này để vẽ dữ liệu chính xác.

Dữ liệu tỷ lệ thất nghiệp đã được nạp sẵn trong bảng tên ur_wide. Bạn nên khám phá bảng này trước khi bắt đầu bài tập.

Hướng dẫn

100 XP
  • Dùng .melt() để unpivot tất cả các cột của ur_wide trừ year và đảm bảo các cột tháng và giá trị lần lượt được đặt tên là month và unempl_rate. Lưu kết quả là ur_tall.
  • Thêm vào ur_tall một cột tên date kết hợp year và month theo định dạng year-month thành một chuỗi dài hơn, rồi chuyển nó sang kiểu dữ liệu ngày.
  • Sắp xếp ur_tall theo date và lưu thành ur_sorted.
  • Dùng ur_sorted, vẽ unempl_rate trên trục y và date trên trục x.