Execução de um pipeline de ETL
Você está pronto para executar seu primeiro pipeline de ETL? Vamos lá!
Aqui, as funções extract()
, transform()
e load()
foram definidas para você. Para executar esse pipeline de ETL de dados, você executará cada uma dessas funções. Se você estiver curioso, dê uma olhada em como é a função extract()
.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Use a função
extract()
para extrair dados do arquivoraw_data.csv
. - Transforme o DataFrame
extracted_data
usando a funçãotransform()
. - Por fim, carregue o DataFrame
transformed_data
na tabela SQLcleaned_data
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")