IniziaInizia gratis

Individuare gli outlier usando l'IQR

Gli outlier possono avere un forte impatto su statistiche come la media, e su quelle che dipendono dalla media, come varianza e deviazione standard. L’intervallo interquartile, o IQR, è un altro modo di misurare la dispersione, meno influenzato dagli outlier. L’IQR è spesso usato anche per trovarli. Se un valore è minore di \(\text{Q1} - 1.5 \times \text{IQR}\) o maggiore di \(\text{Q3} + 1.5 \times \text{IQR}\), è considerato un outlier. In effetti, è così che vengono calcolate le lunghezze dei baffi in un box plot di matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

In questo esercizio calcolerai l’IQR e lo userai per individuare alcuni outlier. pandas come pd e numpy come np sono già caricati e food_consumption è disponibile.

Questo esercizio fa parte del corso

Introduzione alla statistica in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____

print(emissions_by_country)
Modifica ed esegui il codice