ComeçarComece de graça

Carregamento de dados de vendas em um arquivo CSV

O carregamento de dados é um componente essencial de qualquer pipeline de dados. Ele garante que todos os consumidores e processos de dados tenham acesso confiável aos dados que você extraiu e transformou anteriormente em um pipeline. Neste exercício, você praticará o carregamento de dados de vendas transformados em um arquivo CSV usando pandas, que foi importado como pd. Além disso, os dados brutos foram extraídos e estão disponíveis no DataFrame raw_sales_data.

Este exercício faz parte do curso

ETL e ELT em Python

Ver curso

Instruções do exercício

  • Filtre o DataFrame raw_sales_data para que você mantenha apenas todos os itens com preço inferior a 25 dólares.
  • Atualize a função load() para gravar os dados de vendas transformados em um arquivo chamado "transformed_sales_data.csv", certificando-se de não incluir a coluna index.
  • Chame a função load() no Data Frame limpo.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Editar e executar o código