BaşlayınÜcretsiz başlayın

Veri bütünlüğümüz nasıl?

banking DataFrame'ine, inv_amount sütunundaki yatırımların A, B, C ve D olmak üzere dört farklı fon arasında nasıl dağıtıldığını gösteren yeni veriler eklendi.

Ayrıca, müşterilerin yaşı ve doğum günleri sırasıyla age ve birth_date sütunlarında saklanıyor.

Farklı yaş gruplarındaki müşterilerin nasıl yatırım yaptığını anlamak istiyorsun. Ancak önce analiz edeceğin verinin doğru olduğundan emin olmak istiyorsun. Bunu, inv_amount ve age değerlerini farklı fonlara yatırılan tutarlar ve müşterilerin doğum günleriyle çapraz alan kontrolü yaparak gerçekleştireceksin. Hem pandas hem de datetime sırasıyla pd ve dt olarak içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Temizleme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Store fund columns to sum against
fund_columns = ['fund_A', 'fund_B', 'fund_C', 'fund_D']

# Find rows where fund_columns row sum == inv_amount
inv_equ = banking[____].____(____) == ____

# Store consistent and inconsistent data
consistent_inv = ____[____]
inconsistent_inv = ____[____]

# Store consistent and inconsistent data
print("Number of inconsistent investments: ", inconsistent_inv.shape[0])
Kodu Düzenle ve Çalıştır