Een ETL-pijplijn bouwen
Klaar om het een tandje op te schroeven? In deze oefening bouw je de rest van de functie load() en voer je daarna elke stap in het ETL-proces uit. De functies extract() en transform() zijn al voor je gedefinieerd. Succes!
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Oefeninstructies
- Maak de functie
load()af door hetDataFrametransformed_datanaar een.csv-bestand te schrijven met behulp vanfile_name. - Gebruik de functie
transform()om hetDataFrameextracted_dataop te schonen. - Laad
transformed_datanaar het bestandtransformed_data.csvmet de functieload().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def load(data_frame, file_name):
# Write cleaned_data to a CSV using file_name
data_frame.____(____)
print(f"Successfully loaded data to {file_name}")
extracted_data = extract(file_name="raw_data.csv")
# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)
# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")