1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

Follow the money

इस अभ्यास में, आप banking DataFrame के एक और वर्शन के साथ काम कर रहे हैं, जिसमें cust_id और acct_amount दोनों कॉलम में missing values हैं.

आप यह विश्लेषण निकालना चाहते हैं कि बैंक के पास कितने यूनिक ग्राहक हैं, ग्राहकों के पास औसतन कितनी राशि है, आदि. आपको पता है कि जिन पंक्तियों में cust_id missing है, वे आपके काम नहीं आतीं, और औसतन acct_amount आमतौर पर inv_amount की राशि का 5 गुना होता है.

इस अभ्यास में, आप cust_id missing होने वाली banking की पंक्तियाँ हटाएँगे, और डोमेन नॉलेज के आधार पर acct_amount के missing values को इम्प्यूट करेंगे.

निर्देश

100 XP
  • banking में cust_id कॉलम के missing values हटाने के लिए .dropna() का उपयोग करें और परिणाम banking_fullid में रखें.
  • banking_fullid के लिए अनुमानित अकाउंट अमाउंट निकालने हेतु inv_amount * 5 के बराबर सेट करें, और परिणाम acct_imp को असाइन करें.
  • .fillna() का उपयोग करके banking_fullid में acct_amount के missing values को नए बनाए गए acct_imp से इम्प्यूट करें.