Paranın izini sür
Bu egzersizde, hem cust_id sütununda hem de acct_amount sütununda eksik değerler içeren banking adlı başka bir DataFrame ile çalışıyorsun.
Bankanın kaç benzersiz müşterisi olduğunu, müşterilerin ortalama tuttuğu tutarı ve daha fazlasını analiz etmek istiyorsun. cust_id değeri eksik olan satırların sana pek yardımcı olmayacağını ve ortalama olarak acct_amount değerinin genellikle inv_amount tutarının 5 katı olduğunu biliyorsun.
Bu egzersizde, cust_id değeri eksik olan banking satırlarını düşecek ve alan bilgine dayanarak eksik acct_amount değerlerini tahminle dolduracaksın.
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
bankingiçindekicust_idsütunundaki eksik değerleri düşürmek için.dropna()kullan ve sonucubanking_fulliddeğişkenine kaydet.banking_fullidiçin tahmini hesap tutarlarınıinv_amount * 5olarak ayarlayarakinv_amountkullan ve sonucuacct_impdeğişkenine ata.banking_fullidiçindeacct_amountsütununun eksik değerlerini, yeni oluşturduğunacct_impile.fillna()kullanarak doldur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Drop missing values of cust_id
banking_fullid = banking.____(subset = ['____'])
# Compute estimated acct_amount
acct_imp = ____
# Impute missing acct_amount with corresponding acct_imp
banking_imputed = banking_fullid.____({'____':____})
# Print number of missing values
print(banking_imputed.isna().sum())