Membuat dummy nilai hilang
Diberikan sebuah basetable yang memiliki variabel prediktif "total_donations" berisi jumlah total donasi yang pernah dilakukan seorang donor. Variabel ini dapat memiliki nilai hilang, yang mengindikasikan bahwa donor tersebut belum pernah berdonasi sebelumnya. Ini adalah informasi penting tersendiri, sehingga tepat untuk membuat variabel "no_donations" yang menunjukkan apakah "total_donations" bernilai hilang.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Buat kolom baru "no_donations" di
basetableyang bernilai 1 jikatotal_donationshilang dan 0 jika tidak. - Hitung jumlah nilai hilang pada
total_donationsdan tetapkan kenumber_na. - Cetak persentase nilai hilang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])
# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)
# Calculate percentage of missing values
print(round(____ / ____(____), 2))