ComeçarComece gratuitamente

Persistência de dados em arquivos

O carregamento de dados em um destino final é uma das etapas mais importantes de um pipeline de dados. Neste exercício, você usará a função transform() mostrada abaixo para transformar os dados de vendas de produtos antes de carregá-los em um arquivo .csv. Isso dará aos consumidores de dados downstream uma visão melhor do total de vendas em uma variedade de produtos.

Para este exercício, os dados de vendas foram carregados e transformados e estão armazenados no DataFrame clean_sales_data. O pacote pandas foi importado como pd, e a biblioteca os também está pronta para ser usada!

Este exercício faz parte do curso

ETL e ELT em Python

Ver Curso

Instruções de exercício

  • Atualize a função load() para gravar dados no caminho fornecido, sem cabeçalhos ou uma coluna de índice.
  • Verifique se o arquivo foi carregado no caminho de arquivo desejado.
  • Chame a função para carregar os dados transformados no armazenamento persistente.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")
Editar e executar código