1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

संख्यात्मक डेटा या ... ?

इस अभ्यास में, और पूरे अध्याय में, आप San Francisco के साइकिल राइड शेयरिंग डेटा ride_sharing के साथ काम करेंगे। इसमें स्टार्ट और एंड स्टेशनों, ट्रिप की अवधि, और एक बाइक शेयरिंग सेवा के कुछ यूज़र इन्फॉर्मेशन शामिल हैं.

user_type कॉलम बताता है कि कोई यूज़र फ्री राइड ले रहा है या नहीं, और इसमें निम्न मान होते हैं:

  • फ्री राइडर्स के लिए 1.
  • पे-पर-राइड के लिए 2.
  • मंथली सब्सक्राइबर्स के लिए 3.

इस अभ्यास में, आप .info() का उपयोग करके ride_sharing की जानकारी प्रिंट करेंगे और प्रत्यक्ष रूप से देखेंगे कि गलत डेटा टाइप आपकी डेटासेट एनालिसिस को कैसे प्रभावित कर सकता है। pandas पैकेज pd के रूप में इम्पोर्ट किया गया है.

निर्देश 1/3

undefined XP
    1
    2
    3
  • ride_sharing की जानकारी प्रिंट करें.
  • ride_sharing से user_type कॉलम की सारांश सांख्यिकी प्रिंट करने के लिए .describe() का उपयोग करें.