1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

श्रेणियाँ फिर से मैप करना

airlines के सर्वे उत्तरदाताओं को बेहतर समझने के लिए, आप यह जानना चाहते हैं कि कुछ प्रतिक्रियाओं का सप्ताह के दिन और गेट पर प्रतीक्षा समय से कोई संबंध है या नहीं.

airlines DataFrame में day और wait_min कॉलम हैं, जो क्रमशः categorical और numerical हैं. day कॉलम में वह सटीक दिन है जब उड़ान हुई, और wait_min में वे मिनट हैं जो यात्रियों ने गेट पर इंतज़ार किया. अपनी analysis आसान बनाने के लिए, आप दो नए categorical वैरिएबल बनाना चाहते हैं:

  • wait_type: 0-60 min के लिए 'short', 60-180 के लिए 'medium' और 180+ के लिए long
  • day_week: अगर दिन weekday है तो 'weekday', और अगर दिन weekend है तो 'weekend'.

pandas और numpy पैकेज क्रमशः pd और np के रूप में इम्पोर्ट किए जा चुके हैं. आइए कुछ नया categorical डेटा बनाते हैं!

निर्देश

100 XP
  • विवरण में बताए गए अनुसार wait_type कॉलम के लिए ranges और labels बनाएँ.
  • pd.cut() का उपयोग करके wait_min से wait_type कॉलम बनाएँ, और label_ranges तथा label_names को सही arguments में पास करें.
  • weekdays को 'weekday' और weekend days को 'weekend' से map करने वाली mapping dictionary बनाएँ.
  • .replace() का उपयोग करके day_week कॉलम बनाएँ.