1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

हमारी data integrity कैसी है?

नए डेटा को banking DataFrame में मर्ज किया गया है, जिसमें यह विवरण है कि inv_amount कॉलम में किए गए निवेश चार अलग-अलग फ़ंड A, B, C और D में कैसे अलॉट किए गए हैं।

इसके अलावा, ग्राहकों की आयु और जन्मतिथि अब क्रमशः age और birth_date कॉलम में संग्रहीत हैं।

आप यह समझना चाहते हैं कि अलग-अलग आयु समूहों के ग्राहक कैसे निवेश करते हैं। लेकिन उससे पहले, आप यह पक्का करना चाहते हैं कि जिस डेटा का आप विश्लेषण कर रहे हैं, वह सही हो। आप inv_amount और age के मानों को अलग-अलग फ़ंड में किए गए निवेश और ग्राहकों की जन्मतिथियों के साथ क्रॉस-फ़ील्ड जाँच कर के यह सुनिश्चित करेंगे। pandas और datetime क्रमशः pd और dt के रूप में इम्पोर्ट किए गए हैं।

निर्देश 1/2

undefined XP
  • 1
    • banking में fund_columns के सभी कॉलम का row-wise sum जहाँ inv_amount कॉलम के बराबर हो, वे पंक्तियाँ खोजें।
    • inv_amount के संगत मानों वाली पंक्तियाँ consistent_inv में, और असंगत मानों वाली पंक्तियाँ inconsistent_inv में स्टोर करें।
  • 2
    • आज की तारीख को today में स्टोर करें, और ग्राहकों की आयु मैन्युअली निकालकर ages_manual में स्टोर करें।
    • banking की वे सभी पंक्तियाँ खोजें जहाँ age कॉलम ages_manual के बराबर हो, और फिर banking को consistent_ages और inconsistent_ages में फ़िल्टर करें।