Menangani data hilang dengan fill dan drop
Wah… Ada banyak sekali nilai yang hilang di himpunan data ini! Mari kita bersihkan! Dengan berkas CSV yang sudah dimuat, hapus baris yang memiliki nilai null apa pun, lalu tampilkan hasilnya!
Ingat, sudah ada SparkSession bernama spark di workspace Anda!
Latihan ini adalah bagian dari kursus
Pengantar PySpark
Petunjuk latihan
- Hapus baris apa pun yang memiliki nilai null pada DataFrame
census_df. - Tampilkan DataFrame hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____