1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में ETL और ELT

Connected

अभ्यास

डेटा को फाइलों में पर्सिस्ट करना

किसी डेटा पाइपलाइन में अंतिम गंतव्य पर डेटा लोड करना सबसे महत्वपूर्ण चरणों में से एक है. इस अभ्यास में, आप नीचे दिए गए transform() फंक्शन का उपयोग करके प्रोडक्ट सेल्स डेटा को ट्रांसफॉर्म करेंगे और फिर उसे .csv फाइल में लोड करेंगे. इससे डाउनस्ट्रीम डेटा कंज़्यूमर विभिन्न प्रोडक्ट्स में कुल बिक्री को बेहतर ढंग से देख पाएँगे.

इस अभ्यास के लिए, सेल्स डेटा लोड और ट्रांसफॉर्म कर दिया गया है, और clean_sales_data DataFrame में संग्रहीत है. pandas पैकेज pd के रूप में इम्पोर्ट किया गया है, और os लाइब्रेरी भी उपयोग के लिए तैयार है!

निर्देश

100 XP
  • load() फंक्शन को अपडेट करें ताकि दिया गया path उपयोग करके डेटा लिखा जाए, बिना headers और बिना index कॉलम के.
  • जाँच करें कि फाइल इच्छित file path पर लोड हुई है.
  • फंक्शन को कॉल करें ताकि ट्रांसफॉर्म किया हुआ डेटा पर्सिस्टेंट स्टोरेज में लोड हो जाए.