Verkaufsdaten mit Pandas transformieren
Bevor Erkenntnisse aus einem Datensatz gewonnen werden können, müssen die Spaltentypen möglicherweise geändert werden, um die Daten richtig zu nutzen. Das ist besonders bei zeitlichen Datentypen üblich, die auf verschiedene Arten gespeichert werden können.
Für dieses Beispiel wurde pandas
als pd
importiert und steht dir nun zur Verfügung.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Aktualisiere die Funktion
transform()
, um die Daten in der Spalte"Order Date"
in den Typdatetime
zu konvertieren. - Filtere den DataFrame so, dass er nur Zeilen enthält, deren
"Price Each"
weniger als zehn Dollar beträgt. - Gib die Datentypen jeder Spalte im DataFrame aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)