IniziaInizia gratis

Omettere i valori anomali

Ora utilizziamo il dataset student_data per confrontare la distribuzione dei voti finali ("G3") tra studenti che hanno accesso a Internet a casa e quelli che non ce l'hanno. Per farlo, useremo la variabile "internet", che è un indicatore binario (sì/no) della disponibilità di Internet a casa.

Poiché Internet potrebbe essere meno accessibile nelle aree rurali, aggiungeremo dei sottogruppi in base al luogo in cui vive lo studente. Per questo, possiamo usare la variabile "location", che indica se uno studente vive in un'area urbana ("Urban") o rurale ("Rural").

Seaborn è già stato importato come sns e matplotlib.pyplot è stato importato come plt. Ricorda che puoi omettere i valori anomali nei box plot impostando showfliers=False.

Questo esercizio fa parte del corso

Introduzione alla visualizzazione dei dati con Seaborn

Visualizza il corso

Istruzioni dell'esercizio

  • Usa sns.catplot() per creare un box plot con il DataFrame student_data, mettendo "internet" sull'asse x e "G3" sull'asse y.
  • Aggiungi i sottogruppi in modo che ogni box plot sia colorato in base a "location".
  • Non visualizzare i valori anomali.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a box plot with subgroups and omit the outliers






# Show plot
plt.show()
Modifica ed esegui il codice