1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में ETL और ELT

Connected

अभ्यास

ETL Pipeline चलाना

क्या आप अपना पहला ETL पाइपलाइन चलाने के लिए तैयार हैं? चलिए शुरू करते हैं!

यहाँ extract(), transform() और load() फंक्शन आपके लिए पहले से परिभाषित हैं. इस डेटा ETL पाइपलाइन को चलाने के लिए, आपको इन प्रत्येक फंक्शनों को क्रम से चलाना होगा. अगर आप उत्सुक हैं, तो एक नज़र डालिए कि extract() फंक्शन कैसा दिखता है.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

निर्देश

100 XP
  • extract() फंक्शन का उपयोग करके raw_data.csv फ़ाइल से डेटा एक्सट्रैक्ट करें.
  • transform() फंक्शन का उपयोग करके extracted_data DataFrame को ट्रांसफॉर्म करें.
  • अंत में, transformed_data DataFrame को cleaned_data SQL टेबल में लोड करें.