Veri bütünlüğümüz nasıl?
banking DataFrame'ine, inv_amount sütunundaki yatırımların A, B, C ve D olmak üzere dört farklı fon arasında nasıl dağıtıldığını gösteren yeni veriler eklendi.
Ayrıca, müşterilerin yaşı ve doğum günleri sırasıyla age ve birth_date sütunlarında saklanıyor.
Farklı yaş gruplarındaki müşterilerin nasıl yatırım yaptığını anlamak istiyorsun. Ancak önce analiz edeceğin verinin doğru olduğundan emin olmak istiyorsun. Bunu, inv_amount ve age değerlerini farklı fonlara yatırılan tutarlar ve müşterilerin doğum günleriyle çapraz alan kontrolü yaparak gerçekleştireceksin.
Hem pandas hem de datetime sırasıyla pd ve dt olarak içe aktarılmış durumda.
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Store fund columns to sum against
fund_columns = ['fund_A', 'fund_B', 'fund_C', 'fund_D']
# Find rows where fund_columns row sum == inv_amount
inv_equ = banking[____].____(____) == ____
# Store consistent and inconsistent data
consistent_inv = ____[____]
inconsistent_inv = ____[____]
# Store consistent and inconsistent data
print("Number of inconsistent investments: ", inconsistent_inv.shape[0])