Berechnungen mit pandas
Nun erhältst du eine CSV-Datei namens sales.csv
mit Verkaufsdaten in drei Spalten: "user_id"
für die Benutzerkennung, "date"
für das Datum und "order_value"
für den Bestellwert.
Mit pandas
liest du die Datei ein und berechnest dann Statistiken zu den Verkaufswerten.
So wie du bei einem Dictionary anhand des Schlüssels Teilmengen erstellst (z. B. dictionary["key_name"]
), kannst du mithilfe derselben Syntax in pandas
auch Teilmengen aus einer Spalte erstellen. Zudem umfasst das Paket nützliche Methoden für Berechnungen mit DataFrames oder Teilmengen von DataFrames (z. B. Spalten).
Beispiele für diese Syntax sind df["column_name"].mean()
und df["column_name"].sum()
, um den Durchschnitt bzw. die Summe für eine bestimmte Spalte zu berechnen.
Diese Übung ist Teil des Kurses
Entwicklung mit Python für Fortgeschrittene
Anleitung zur Übung
- Lies die Datei
"sales.csv"
ein und speichere sie als pandas-DataFrame namenssales_df
. - Erstelle eine Teilmenge von
sales_df
aus der Spalte"order_value"
und rufe dann die Methode.mean()
auf, um den durchschnittlichen Bestellwert zu ermitteln. - Erstelle eine Teilmenge von
sales_df
aus der Spalte"order_value"
und rufe dann die Methode.sum()
auf, um den Gesamtwert aller Bestellungen zu ermitteln.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Read in sales.csv
sales_df = ____.____("____")
# Print the mean order_value
print(sales_df["____"].____())
# Print the total value of sales
print(sales_df["____"].____())