Aan de slagGa gratis aan de slag

Een ETL-pijplijn bouwen

Klaar om het een tandje op te schroeven? In deze oefening bouw je de rest van de functie load() en voer je daarna elke stap in het ETL-proces uit. De functies extract() en transform() zijn al voor je gedefinieerd. Succes!

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Cursus bekijken

Oefeninstructies

  • Maak de functie load() af door het DataFrame transformed_data naar een .csv-bestand te schrijven met behulp van file_name.
  • Gebruik de functie transform() om het DataFrame extracted_data op te schonen.
  • Laad transformed_data naar het bestand transformed_data.csv met de functie load().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

def load(data_frame, file_name):
  # Write cleaned_data to a CSV using file_name
  data_frame.____(____)
  print(f"Successfully loaded data to {file_name}")

extracted_data = extract(file_name="raw_data.csv")

# Transform extracted_data using transform() function
transformed_data = ____(data_frame=____)

# Load transformed_data to the file transformed_data.csv
____(data_frame=____, file_name="transformed_data.csv")
Code bewerken en uitvoeren