1. Learn
  2. /
  3. Курси
  4. /
  5. ETL та ELT у Python

Connected

вправа

Валідація конвеєра даних на «контрольних точках»

У цій вправі ви працюватимете з конвеєром даних, який вилучає податкові дані з файлу CSV, створює новий стовпець, відфільтровує рядки за середнім оподатковуваним доходом і зберігає дані у файл parquet.

pandas завантажено як pd, а функції extract(), transform() і load() уже визначені. Ви використаєте ці функції, щоб перевірити коректність конвеєра даних на різних контрольних точках під час його виконання.

Інструкції 1/3

undefined XP
    1
    2
    3
  • Виведіть розмірність датафреймів raw_tax_data і clean_tax_data та зверніть увагу на різницю у вимірах.