1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

गायब निवेशक

मिसिंग डेटा से निपटना डेटा साइंस के सबसे आम कामों में से एक है। मिसिंगनेस के कई प्रकार होते हैं, और उनके समाधान के भी कई तरीके होते हैं।

आपको अभी banking DataFrame का नया वर्ज़न मिला है, जिसमें नए और मौजूदा कस्टमर्स के पास रखी और निवेश की गई रकम का डेटा है। हालाँकि, कुछ पंक्तियों में inv_amount के मान गायब हैं।

आपको पक्का पता है कि 25 साल से कम उम्र के ज़्यादातर कस्टमर्स के पास अभी निवेश अकाउंट नहीं हैं, और आपको शक है कि यही मिसिंगनेस की वजह हो सकती है। pandas, missingno और matplotlib.pyplot पैकेज क्रमशः pd, msno और plt नाम से इम्पोर्ट किए जा चुके हैं। banking DataFrame आपके वातावरण में मौजूद है।

निर्देश 1/4

undefined XP
    1
    2
    3
    4
  • banking DataFrame में कॉलम-दर-कॉलम मिसिंग वैल्यूज़ की संख्या प्रिंट करें।
  • msno.matrix() फंक्शन से banking का मिसिंगनेस मैट्रिक्स प्लॉट करें और दिखाएँ।