Aan de slagGa gratis aan de slag

Gegevens opslaan naar bestanden

Data naar een eindbestemming laden is een van de belangrijkste stappen in een datapijplijn. In deze oefening gebruik je de hieronder getoonde functie transform() om verkoopgegevens van producten te transformeren voordat je ze naar een .csv-bestand schrijft. Zo krijgen downstream-datagebruikers beter inzicht in de totale verkoop over verschillende producten.

Voor deze oefening zijn de verkoopgegevens al geladen en getransformeerd en staan ze in de DataFrame clean_sales_data. Het pakket pandas is geïmporteerd als pd, en de os-bibliotheek is ook klaar voor gebruik!

Deze oefening maakt deel uit van de cursus

ETL en ELT in Python

Cursus bekijken

Oefeninstructies

  • Werk de functie load() bij zodat deze data naar het opgegeven pad schrijft, zonder kopregels of indexkolom.
  • Controleer of het bestand naar het gewenste bestandspad is geladen.
  • Roep de functie aan om de getransformeerde data naar permanente opslag te schrijven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")
Code bewerken en uitvoeren