Mengimputasi dan mengisi nilai hilang menggunakan rata-rata
Saat Anda melakukan analisis, kemungkinan Anda akan menggunakan data sendiri. Himpunan data sering kali memiliki beberapa nilai yang hilang. Pada latihan ini, Anda akan berlatih mengimputasi nilai-nilai yang hilang tersebut. Mengimputasi nilai hilang penting agar nilai yang hilang tidak menjadi hambatan dalam analisis kita.
pandas telah dimuat dengan alias pd dan NumPy telah dimuat dengan alias np. Sebuah pandas DataFrame bernama dataset telah disediakan untuk Anda. DataFrame ini memiliki kolom "Total Current Liabilities" yang berisi beberapa nilai hilang.
Latihan ini adalah bagian dari kursus
Menganalisis Laporan Keuangan dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Impute missing value using average non-missing values by company
impute_by_company = dataset.____
# Impute missing value using average non-missing values by industry
impute_by_comp_type = dataset.____
print(impute_by_company)
print(impute_by_comp_type)