1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

Back to the future

ride_sharing DataFrame को फ़ीड करने वाली डेटा पाइपलाइन में नए अपडेट के बाद अब हर राइड की तारीख रिकॉर्ड होती है. यह जानकारी ride_date कॉलम में स्टोर होती है, जिसका टाइप object है, यानी pandas में यह स्ट्रिंग्स को दर्शाता है.

एक बग मिला है जो आज की गई राइड्स को अगले साल की राइड्स के रूप में दर्ज कर रहा था. इसे ठीक करने के लिए, आप ride_date कॉलम में भविष्य की सभी तारीखों को खोजेंगे और इस कॉलम का अधिकतम संभव मान आज की तारीख सेट करेंगे. ऐसा करने से पहले, आपको ride_date को datetime ऑब्जेक्ट में कन्वर्ट करना होगा.

datetime पैकेज को dt नाम से इम्पोर्ट किया गया है, साथ ही अब तक उपयोग किए जा रहे बाकी पैकेज भी उपलब्ध हैं.

निर्देश

100 XP
  • to_datetime() का उपयोग करके ride_date को datetime ऑब्जेक्ट में कन्वर्ट करें, फिर उस datetime ऑब्जेक्ट को date में बदलकर ride_dt कॉलम में स्टोर करें.
  • वैरिएबल today बनाएँ, जिसमें आज की तारीख dt.date.today() फंक्शन से स्टोर हो.
  • भविष्य में आने वाले सभी ride_dt मानों को आज की तारीख सेट करें.
  • ride_dt कॉलम में अधिकतम तारीख प्रिंट करें.