Buat scatter plot dengan indikasi missingness
Dalam latihan ini Anda akan membuat scatter plot yang terdiri dari nilai hilang dan tidak hilang. Anda akan menggunakan fungsi fill_dummy_values() yang Anda buat pada latihan sebelumnya untuk mengisikan nilai dummy ke dalam DataFrame diabetes_dummy.
Kekosongan (nullity) suatu kolom dihitung menggunakan metode .isnull(). Hasilnya berupa Series (pd.Series) berisi True atau False.
Untuk memberi warna berbeda pada nilai hilang dan tidak hilang, Anda dapat menggabungkan nullity menggunakan operasi OR (|) pada kolom yang Anda plot, sehingga menghasilkan:
True\(\rightarrow\) Salah satu daricol1ataucol2, atau keduanya, bernilai hilang.False\(\rightarrow\) Baikcol1maupuncol2tidak ada yang hilang.
DataFrame diabetes dan fungsi fill_dummy_values() telah dimuat untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Petunjuk latihan
- Gunakan operasi OR untuk menggabungkan nullity dari
Skin_FolddanBMI. - Isi nilai dummy pada
diabetes_dummymenggunakan fungsifill_dummy_values(). - Buat scatter plot
'BMI'terhadap'Skin_Fold'; perhatikan Y terhadap X berarti sumbu-Y terhadap sumbu-X atau Y sebagai fungsi dari X.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___
# Fill dummy values in diabetes_dummy
diabetes_dummy = ___
# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,
# Set color to nullity of BMI and Skin_Fold
c=___,
cmap='rainbow')
plt.show()