Carregamento de dados de vendas em um arquivo CSV
O carregamento de dados é um componente essencial de qualquer pipeline de dados. Ele garante que todos os consumidores e processos de dados tenham acesso confiável aos dados que você extraiu e transformou anteriormente em um pipeline. Neste exercício, você praticará o carregamento de dados de vendas transformados em um arquivo CSV usando pandas
, que foi importado como pd
. Além disso, os dados brutos foram extraídos e estão disponíveis no DataFrame raw_sales_data
.
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Filtre o DataFrame
raw_sales_data
para que você mantenha apenas todos os itens com preço inferior a 25 dólares. - Atualize a função
load()
para gravar os dados de vendas transformados em um arquivo chamado"transformed_sales_data.csv"
, certificando-se de não incluir a colunaindex
. - Chame a função
load()
no Data Frame limpo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)