MulaiMulai sekarang secara gratis

Membuat dummy nilai hilang

Diberikan sebuah basetable yang memiliki variabel prediktif "total_donations" berisi jumlah total donasi yang pernah dilakukan seorang donor. Variabel ini dapat memiliki nilai hilang, yang mengindikasikan bahwa donor tersebut belum pernah berdonasi sebelumnya. Ini adalah informasi penting tersendiri, sehingga tepat untuk membuat variabel "no_donations" yang menunjukkan apakah "total_donations" bernilai hilang.

Latihan ini adalah bagian dari kursus

Predictive Analytics Tingkat Menengah dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat kolom baru "no_donations" di basetable yang bernilai 1 jika total_donations hilang dan 0 jika tidak.
  • Hitung jumlah nilai hilang pada total_donations dan tetapkan ke number_na.
  • Cetak persentase nilai hilang.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])

# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)

# Calculate percentage of missing values
print(round(____ / ____(____), 2))
Edit dan Jalankan Kode