Effiziente Zusammenfassungen
pandas und NumPy bieten zwar sehr viele Funktionen, aber manchmal brauchst du vielleicht eine ganz individuelle Funktion, um deine Daten zusammenzufassen.
Mit der Methode .agg()
kannst du eigene Funktionen auf einen DataFrame anwenden sowie Funktionen auf mehrere Spalten eines DataFrame gleichzeitig anwenden – zugunsten besonders effizienter Aggregationen. Ein Beispiel:
df['column'].agg(function)
In der benutzerdefinierten Funktion für diese Übung steht "IQR" ist die Abkürzung für Interquartilsabstand, also der Wert, der den 75. Perzentil vom 25. Perzentil abzieht. Er ist eine Alternative zur Standardabweichung und hilfreich, wenn deine Daten Ausreißer enthalten.
sales
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# A custom IQR function
def iqr(column):
return column.quantile(0.75) - column.quantile(0.25)
# Print IQR of the temperature_c column
print(____)