1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में ETL और ELT

Connected

अभ्यास

Fixtures के साथ data pipeline का unit testing

आपने पिछले वीडियो में सीखा कि unit testing आपकी data pipeline पर अधिक भरोसा करने में मदद करती है, और डेवलपमेंट के दौरान बग्स पकड़ने में भी सहायक होती है। इस अभ्यास में, आप pytest लाइब्रेरी और assert का उपयोग करके fixtures और unit tests दोनों लिखने का अभ्यास करेंगे।

जिस transform फंक्शन के आसपास आप unit tests बनाएँगे, वह संदर्भ के लिए नीचे दिया गया है। pandas को pd नाम से इम्पोर्ट किया गया है, और pytest() लाइब्रेरी लोड होकर उपयोग के लिए तैयार है।

def transform(raw_data):
    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
    raw_data.set_index("industry_name", inplace=True)
    return raw_data

निर्देश 1/2

undefined XP
    1
    2
  • clean_tax_data नाम का एक pytest fixture बनाएँ।
  • transform() फंक्शन को raw_data डेटासेट पर अप्लाई करें, और परिणाम को clean_data वैरिएबल में सेव करके उसे रिटर्न करें।