Memeriksa nilai yang hilang
Mengidentifikasi nilai yang hilang penting untuk analisis. Dengan menggunakan himpunan data yang sama, Anda akan memperoleh total jumlah nilai yang hilang dengan melakukan iterasi pada baris dan kolom dalam himpunan data. Setelah menemukan nilai yang hilang, diperlukan metode lanjutan untuk menanganinya, misalnya menggunakan Imputer dari sklearn. Nilai yang hilang perlu ditangani, jika tidak, akan sulit melakukan prediksi CTR yang tepat.
Data contoh dalam bentuk DataFrame telah dimuat sebagai df. pandas sebagai pd juga tersedia di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Cetak ringkasan dasar kolom menggunakan
.info(). - Cetak nilai yang hilang per kolom, menggunakan
.isnull()(jangan lupa tanda kurung!). - Cetak total jumlah nilai yang hilang per baris menggunakan
axis = 1dan.sum().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)