MulaiMulai sekarang secara gratis

Eksplorasi himpunan data Jobs

Dalam latihan ini, Anda akan mengeksplorasi DataFrame jobs yang berisi tingkat pengangguran berbagai industri di AS selama tahun 2000–2010. Seperti yang akan Anda lihat, himpunan data ini memuat deret waktu untuk 16 industri dan mencakup 122 titik waktu (satu per bulan selama 10 tahun). Secara umum, alur kerja khas proyek Data Science mencakup pembersihan dan eksplorasi data, jadi kita akan mulai dengan membaca data dan memeriksa nilai yang hilang.

Latihan ini adalah bagian dari kursus

Memvisualisasikan Data Deret Waktu di Python

Lihat Kursus

Petunjuk latihan

Kami telah mengimpor pandas sebagai pd.

  • Baca berkas CSV yang berada di url_jobs ke dalam sebuah DataFrame bernama jobs dan tinjau tipe data setiap kolom.
  • Konversikan kolom datestamp di jobs ke tipe datetime.
  • Jadikan kolom datestamp sebagai indeks jobs.
  • Cetak jumlah nilai hilang pada setiap kolom di jobs.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())
Edit dan Jalankan Kode