ComeçarComece de graça

Executando um pipeline de ETL

Pronto para executar seu primeiro pipeline de ETL? Vamos lá!

Aqui, as funções extract(), transform() e load() já foram definidas para você. Para executar este pipeline de ETL de dados, você vai chamar cada uma dessas funções. Se ficar curioso, dê uma olhada em como é a função extract().

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Este exercício faz parte do curso

ETL and ELT em Python

Ver curso

Instruções do exercício

  • Use a função extract() para extrair dados do arquivo raw_data.csv.
  • Transforme o DataFrame extracted_data usando a função transform().
  • Por fim, carregue o DataFrame transformed_data na tabela SQL cleaned_data.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Editar e executar o código