Validação de transformações de dados
Você fez um ótimo trabalho até agora! Verificar manualmente as transformações é uma ótima primeira etapa para garantir que você mantenha a qualidade dos dados em todo o pipeline. O site pandas oferece várias funções integradas para ajudar você a fazer exatamente isso!
Para ajudar você a começar este exercício, pandas foi importado como pd.
Este exercício faz parte do curso
ETL and ELT em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")