Mengganti nilai hilang yang tersembunyi
Dalam dua latihan sebelumnya, Anda telah mengidentifikasi dan menangani nilai hilang saat mengimpor himpunan data. Pada latihan ini, Anda akan mengidentifikasi nilai hilang yang tersembunyi di data Anda dan menanganinya. Anda akan menggunakan himpunan data diabetes yang sudah dimuat untuk Anda.
DataFrame diabetes memiliki nilai 0 pada kolom BMI. Namun BMI tidak mungkin bernilai 0. Nilai tersebut seharusnya NaN. Dalam latihan ini, Anda akan belajar mengidentifikasi ketidaksesuaian seperti ini. Anda akan melakukan analisis data sederhana untuk menemukan nilai hilang dan menggantinya. Baik numpy maupun pandas telah diimpor ke dalam lingkungan Anda masing-masing sebagai np dan pd.
Selain itu, Anda dapat mencoba-coba dengan himpunan data ini, misalnya mencetak .head(), .info(), dan sebagainya untuk lebih mengenal datanya.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the description of the data
print(___)