1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Trực quan hóa dữ liệu chuỗi thời gian trong Python

Connected

Bài tập

Khám phá bộ dữ liệu Jobs

Trong bài tập này, bạn sẽ khám phá DataFrame jobs mới, chứa tỷ lệ thất nghiệp của các ngành khác nhau ở Hoa Kỳ trong giai đoạn 2000–2010. Như bạn sẽ thấy, bộ dữ liệu gồm các chuỗi thời gian cho 16 ngành và 122 mốc thời gian (mỗi tháng trong 10 năm). Nhìn chung, quy trình điển hình của một dự án Khoa học Dữ liệu sẽ bao gồm làm sạch và khám phá dữ liệu, nên chúng ta sẽ bắt đầu bằng cách đọc dữ liệu và kiểm tra các giá trị khuyết.

Hướng dẫn

100 XP

Chúng tôi đã import pandas với tên pd.

  • Đọc tệp csv ở url_jobs vào một DataFrame tên jobs và xem kiểu dữ liệu của từng cột.
  • Chuyển cột datestamp trong jobs sang kiểu datetime.
  • Đặt cột datestamp làm index của jobs.
  • In ra số lượng giá trị khuyết ở mỗi cột của jobs.