MulaiMulai sekarang secara gratis

Mengimputasi nilai hilang dengan persentil

Dalam latihan ini, Anda akan terus berlatih mengimputasi nilai yang hilang. Berbeda dengan latihan sebelumnya, kali ini Anda akan menggunakan persentil sebagai pengganti rata-rata untuk menghitung imputasi. Menggunakan persentil adalah cara yang baik untuk mendapatkan imputasi yang konservatif. Mengimputasi nilai hilang dalam sebuah kolom menggunakan persentil melibatkan langkah-langkah berikut:

  • Hapus nilai yang hilang dari kolom yang menjadi fokus.
  • Kemudian hitung, misalnya persentil ke-70 dari angka-angka pada kolom setelah nilai hilangnya dihapus.
  • Nilai terburuk persentil ke-70 bergantung pada kolom tempat Anda menghitung persentil:
    • Misalnya, jumlah aset yang besar dianggap baik, sehingga jumlah aset yang rendah lebih buruk. Nilai terburuk persentil ke-70 untuk aset sebenarnya adalah persentil ke-30 aset.
    • Secara analog, jumlah liabilitas yang tinggi dianggap buruk. Jadi nilai terburuk persentil ke-70 untuk liabilitas sama dengan persentil ke-70 liabilitas itu sendiri.

pandas telah dimuat dengan alias pd dan NumPy telah dimuat dengan alias np. Sebuah DataFrame pandas bernama dataset telah disiapkan untuk Anda. DataFrame ini memiliki kolom "Total Current Liabilities" yang mengandung beberapa nilai hilang.

Latihan ini adalah bagian dari kursus

Menganalisis Laporan Keuangan dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Impute missing value with 70th percentile non-missing values of company
impute_by_company = ___

# Impute missing value with 70th percentile non-missing values of industry
impute_by_comp_type = ____

print(impute_by_company)
print(impute_by_comp_type)
Edit dan Jalankan Kode