Efficiënte samenvattingen
Hoewel pandas en NumPy veel functies hebben, heb je soms een andere functie nodig om je gegevens samen te vatten.
Met de methode .agg() kun je je eigen functies toepassen op een DataFrame en zelfs functies in één keer op meerdere kolommen loslaten. Zo maak je je samenstellingen heel efficiënt. Bijvoorbeeld,
df['column'].agg(function)
In de aangepaste functie voor deze oefening staat "IQR" voor interkwartielafstand: het 75e percentiel min het 25e percentiel. Dit is een alternatief voor de standaardafwijking en handig als je gegevens uitschieters bevatten.
sales is beschikbaar en pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# A custom IQR function
def iqr(column):
return column.quantile(0.75) - column.quantile(0.25)
# Print IQR of the temperature_c column
print(____)