1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

Strings को जोड़ना और numbers को concatenation करना

पिछले अभ्यास में, आपने पहचाना था कि user_type के लिए सही डेटा टाइप category है और उसे कन्वर्ट भी किया था ताकि वितरण समझने के लिए उपयुक्त सांख्यिकीय सार-तत्व निकाले जा सकें.

एक और आम डेटा टाइप समस्या यह है कि जिन मानों को संख्यात्मक होना चाहिए, वे strings के रूप में इम्पोर्ट हो जाते हैं. ऐसे में जोड़ (sum) या गुणा जैसी गणितीय क्रियाएँ string concatenation दे देती हैं, न कि संख्यात्मक आउटपुट.

इस अभ्यास में, आप string कॉलम duration को int टाइप में बदलेंगे. उससे पहले, आपको कॉलम से "minutes" हटाना होगा ताकि pandas उसे संख्यात्मक के रूप में पढ़े. pandas पैकेज pd नाम से इम्पोर्ट किया गया है.

निर्देश

100 XP
  • .strip() मेथड का उपयोग करके duration से "minutes" हटाएँ और परिणाम duration_trim कॉलम में स्टोर करें.
  • duration_trim को int में कन्वर्ट करें और उसे duration_time कॉलम में स्टोर करें.
  • एक assert स्टेटमेंट लिखें जो जाँच करे कि अब duration_time का data type int है.
  • औसत ride duration प्रिंट करें.