Persistieren von Daten in Dateien
Das Laden von Daten an ein endgültiges Ziel ist einer der wichtigsten Schritte in einer Datenpipeline. In dieser Übung verwendest du die unten gezeigte Funktion transform()
, um Produktverkaufsdaten umzuwandeln, bevor du sie in eine .csv
Datei lädst. Dadurch erhalten die nachgelagerten Datenkonsumenten einen besseren Überblick über die Gesamtverkäufe einer Reihe von Produkten.
Für diese Übung wurden die Verkaufsdaten geladen und transformiert und im DataFrame clean_sales_data
gespeichert. Das Paket pandas
wurde als pd
importiert, und die Bibliothek os
ist ebenfalls einsatzbereit!
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Aktualisiere die Funktion
load()
, um Daten in den angegebenen Pfad zu schreiben, ohne Kopfzeilen oder eine Indexspalte. - Vergewissere dich, dass die Datei in den gewünschten Dateipfad geladen wurde.
- Rufe die Funktion auf, um die umgewandelten Daten in den persistenten Speicher zu laden.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def load(clean_data, file_path):
# Write the data to a file
clean_data.to_csv(file_path, ____, ____)
# Check to make sure the file exists
file_exists = os.____.____(____)
if not file_exists:
raise Exception(f"File does NOT exists at path {file_path}")
# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")