1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în vizualizarea datelor cu Seaborn

Connected

exercițiu

Eliminarea valorilor extreme

Acum vom folosi setul de date student_data pentru a compara distribuția notelor finale ("G3") între elevii care au acces la internet acasă și cei care nu au. În acest scop, vom utiliza variabila "internet", un indicator binar (da/nu) care arată dacă elevul are internet acasă.

Deoarece accesul la internet poate fi mai limitat în zonele rurale, vom adăuga subgrupuri în funcție de locul în care locuiește elevul. Putem folosi variabila "location", care indică dacă un elev trăiește într-o zonă urbană ("Urban") sau rurală ("Rural").

Seaborn a fost deja importat ca sns, iar matplotlib.pyplot a fost importat ca plt. Reamintim că poți elimina valorile extreme din box plot-uri setând showfliers=False.

Instrucțiuni

100 XP
  • Folosește sns.catplot() pentru a crea un box plot cu DataFrame-ul student_data, punând "internet" pe axa x și "G3" pe axa y.
  • Adaugă subgrupuri, astfel încât fiecare box plot să fie colorat în funcție de "location".
  • Nu afișa valorile extreme.