Persistência de dados em arquivos
O carregamento de dados em um destino final é uma das etapas mais importantes de um pipeline de dados. Neste exercício, você usará a função transform()
mostrada abaixo para transformar os dados de vendas de produtos antes de carregá-los em um arquivo .csv
. Isso dará aos consumidores de dados downstream uma visão melhor do total de vendas em uma variedade de produtos.
Para este exercício, os dados de vendas foram carregados e transformados e estão armazenados no DataFrame clean_sales_data
. O pacote pandas
foi importado como pd
, e a biblioteca os
também está pronta para ser usada!
Este exercício faz parte do curso
ETL e ELT em Python
Instruções de exercício
- Atualize a função
load()
para gravar dados no caminho fornecido, sem cabeçalhos ou uma coluna de índice. - Verifique se o arquivo foi carregado no caminho de arquivo desejado.
- Chame a função para carregar os dados transformados no armazenamento persistente.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
def load(clean_data, file_path):
# Write the data to a file
clean_data.to_csv(file_path, ____, ____)
# Check to make sure the file exists
file_exists = os.____.____(____)
if not file_exists:
raise Exception(f"File does NOT exists at path {file_path}")
# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")