fill ve drop ile eksik verileri ele alma
Aman… Bu veri kümesinde çok fazla eksik değer var! Hadi temizleyelim! Yüklenmiş CSV dosyasıyla, null içeren satırları düşür ve sonuçları göster!
Unutma, çalışma alanında zaten spark adlı bir SparkSession var!
Bu egzersiz, kursun bir parçasıdır
PySpark'e Giriş
Egzersiz talimatları
census_dfDataFrame'indeki null değer içeren satırların hepsini düşür.- Ortaya çıkan DataFrame'i göster.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____