Persistieren von Daten in Dateien

Das Laden von Daten an ein endgültiges Ziel ist einer der wichtigsten Schritte in einer Datenpipeline. In dieser Übung verwendest du die unten gezeigte Funktion transform(), um Produktverkaufsdaten umzuwandeln, bevor du sie in eine .csv Datei lädst. Dadurch erhalten die nachgelagerten Datenkonsumenten einen besseren Überblick über die Gesamtverkäufe einer Reihe von Produkten.

Für diese Übung wurden die Verkaufsdaten geladen und transformiert und im clean_sales_data DataFrame gespeichert. Das Paket pandas wurde als pd importiert, und die Bibliothek os ist ebenfalls einsatzbereit!

Diese Übung ist Teil des Kurses

<Kurs>ETL und ELT mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Aktualisiere die Funktion load(), um Daten in den angegebenen Pfad zu schreiben, ohne Kopfzeilen oder eine Indexspalte.
Vergewissere dich, dass die Datei in den gewünschten Dateipfad geladen wurde.
Rufe die Funktion auf, um die umgewandelten Daten in den persistenten Speicher zu laden.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")

Code bearbeiten und ausführen