Datenumwandlungen validieren
Tolle Arbeit bis jetzt! Die manuelle Stichprobenkontrolle von Transformationen ist ein wichtiger erster Schritt, um sicherzustellen, dass die Datenqualität in der gesamten Pipeline erhalten bleibt. pandas bietet mehrere integrierte Funktionen, die dir dabei helfen!
Um dir den Einstieg in diese Übung zu erleichtern, wurde pandas als pd importiert.
Diese Übung ist Teil des Kurses
<Kurs>ETL und ELT mit Python</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")