Membuat dummy nilai hilang
Diberikan sebuah basetable yang memiliki variabel prediktif "total_donations" berisi jumlah total donasi yang pernah dilakukan seorang donor. Variabel ini dapat memiliki nilai hilang, yang mengindikasikan bahwa donor tersebut belum pernah berdonasi sebelumnya. Ini adalah informasi penting tersendiri, sehingga tepat untuk membuat variabel "no_donations" yang menunjukkan apakah "total_donations" bernilai hilang.
Latihan ini merupakan bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Instruksi latihan
- Buat kolom baru "no_donations" di
basetableyang bernilai 1 jikatotal_donationshilang dan 0 jika tidak. - Hitung jumlah nilai hilang pada
total_donationsdan tetapkan kenumber_na. - Cetak persentase nilai hilang.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])
# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)
# Calculate percentage of missing values
print(round(____ / ____(____), 2))