IniziaInizia gratis

Statistiche riassuntive efficienti

Anche se pandas e NumPy offrono molte funzioni integrate, a volte potresti aver bisogno di qualcosa di più specifico per riassumere i tuoi dati.

Il metodo .agg() ti permette di utilizzare funzioni personalizzate su un DataFrame e di applicarle anche a più colonne contemporaneamente, rendendo le tue aggregazioni molto più efficienti. Ad esempio:

df['column'].agg(function)

Nella funzione personalizzata di questo esercizio, "IQR" è l’abbreviazione di intervallo interquartile, ovvero la differenza tra il 75° e il 25° percentile. Si tratta di un’alternativa alla deviazione standard che può essere utile quando i dati contengono valori anomali (outlier).

sales è a tua disposizione e pandas è già stato caricato come pd.

Questo esercizio fa parte del corso

Manipolazione dei dati con pandas

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# A custom IQR function
def iqr(column):
    return column.quantile(0.75) - column.quantile(0.25)
    
# Print IQR of the temperature_c column
print(____)
Modifica ed esegui il codice