Menghapus baris
Jika Anda tahu bahwa suatu kolom akan sangat penting bagi analisis Anda, dan hanya sebagian kecil baris yang tidak memiliki nilai pada kolom tersebut, sering kali masuk akal untuk menghapus baris-baris itu dari himpunan data.
Sepanjang kursus ini, kolom driver_gender akan krusial untuk banyak analisis Anda. Karena hanya sebagian kecil baris yang tidak memiliki driver_gender, kita akan menghapus baris-baris tersebut dari himpunan data.
Latihan ini adalah bagian dari kursus
Menganalisis Aktivitas Polisi dengan pandas
Petunjuk latihan
- Hitung jumlah nilai yang hilang di setiap kolom.
- Hapus semua baris yang tidak memiliki
driver_genderdengan memberikan nama kolom tersebut ke parametersubsetdari.dropna(). - Hitung kembali jumlah nilai yang hilang di setiap kolom, untuk memastikan tidak ada baris yang tersisa tanpa
driver_gender. - Periksa
.shapedari DataFrame untuk melihat berapa banyak baris dan kolom yang tersisa.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Count the number of missing values in each column
print(ri.isnull().____)
# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)
# Count the number of missing values in each column (again)
print(ri.____.____)
# Examine the shape of the DataFrame
print(____)