Datenumwandlungen validieren
Tolle Arbeit bis jetzt! Die manuelle Stichprobenkontrolle von Transformationen ist ein wichtiger erster Schritt, um sicherzustellen, dass die Datenqualität in der gesamten Pipeline erhalten bleibt. pandas
bietet mehrere integrierte Funktionen, die dir dabei helfen!
Um dir den Einstieg in diese Übung zu erleichtern, wurde pandas
als pd
importiert.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")