Validação de transformações de dados
Você fez um ótimo trabalho até agora! Verificar manualmente as transformações é uma ótima primeira etapa para garantir que você mantenha a qualidade dos dados em todo o pipeline. O site pandas
oferece várias funções integradas para ajudar você a fazer exatamente isso!
Para ajudar você a começar com este exercício, pandas
foi importado como pd
.
Este exercício faz parte do curso
ETL e ELT em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")