Datenumwandlungen validieren
Tolle Arbeit bis jetzt! Die manuelle Stichprobenkontrolle von Transformationen ist ein wichtiger erster Schritt, um sicherzustellen, dass die Datenqualität in der gesamten Pipeline erhalten bleibt. pandas
bietet mehrere integrierte Funktionen, die dir dabei helfen!
Um dir den Einstieg in diese Übung zu erleichtern, wurde pandas
als pd
importiert.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")