Eksplorasi himpunan data Jobs
Dalam latihan ini, Anda akan mengeksplorasi DataFrame jobs yang berisi tingkat pengangguran berbagai industri di AS selama tahun 2000–2010. Seperti yang akan Anda lihat, himpunan data ini memuat deret waktu untuk 16 industri dan mencakup 122 titik waktu (satu per bulan selama 10 tahun). Secara umum, alur kerja khas proyek Data Science mencakup pembersihan dan eksplorasi data, jadi kita akan mulai dengan membaca data dan memeriksa nilai yang hilang.
Latihan ini adalah bagian dari kursus
Memvisualisasikan Data Deret Waktu di Python
Petunjuk latihan
Kami telah mengimpor pandas sebagai pd.
- Baca berkas CSV yang berada di
url_jobske dalam sebuah DataFrame bernamajobsdan tinjau tipe data setiap kolom. - Konversikan kolom
datestampdijobske tipedatetime. - Jadikan kolom
datestampsebagai indeksjobs. - Cetak jumlah nilai hilang pada setiap kolom di
jobs.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())