Menangani data hilang dengan fill dan drop
Wah… Ada banyak sekali nilai yang hilang di himpunan data ini! Mari kita bersihkan! Dengan berkas CSV yang sudah dimuat, hapus baris yang memiliki nilai null apa pun, lalu tampilkan hasilnya!
Ingat, sudah ada SparkSession bernama spark di workspace Anda!
Latihan ini merupakan bagian dari kursus
Pengantar PySpark
Instruksi latihan
- Hapus baris apa pun yang memiliki nilai null pada DataFrame
census_df. - Tampilkan DataFrame hasilnya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____