MulaiMulai sekarang secara gratis

Buat scatter plot dengan indikasi missingness

Dalam latihan ini Anda akan membuat scatter plot yang terdiri dari nilai hilang dan tidak hilang. Anda akan menggunakan fungsi fill_dummy_values() yang Anda buat pada latihan sebelumnya untuk mengisikan nilai dummy ke dalam DataFrame diabetes_dummy.

Kekosongan (nullity) suatu kolom dihitung menggunakan metode .isnull(). Hasilnya berupa Series (pd.Series) berisi True atau False.

Untuk memberi warna berbeda pada nilai hilang dan tidak hilang, Anda dapat menggabungkan nullity menggunakan operasi OR (|) pada kolom yang Anda plot, sehingga menghasilkan:

  • True \(\rightarrow\) Salah satu dari col1 atau col2, atau keduanya, bernilai hilang.
  • False \(\rightarrow\) Baik col1 maupun col2 tidak ada yang hilang.

DataFrame diabetes dan fungsi fill_dummy_values() telah dimuat untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan operasi OR untuk menggabungkan nullity dari Skin_Fold dan BMI.
  • Isi nilai dummy pada diabetes_dummy menggunakan fungsi fill_dummy_values().
  • Buat scatter plot 'BMI' terhadap 'Skin_Fold'; perhatikan Y terhadap X berarti sumbu-Y terhadap sumbu-X atau Y sebagai fungsi dari X.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___

# Fill dummy values in diabetes_dummy
diabetes_dummy = ___

# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,                     
                    # Set color to nullity of BMI and Skin_Fold
                    c=___, 
                    cmap='rainbow')

plt.show()
Edit dan Jalankan Kode