1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do wizualizacji danych z Seaborn

Connected

ćwiczenie

Ukrywanie wartości odstających

Teraz użyjemy zbioru danych student_data, aby porównać rozkład ocen końcowych ("G3") wśród uczniów, którzy mają dostęp do internetu w domu, i tych, którzy go nie mają. W tym celu skorzystamy ze zmiennej "internet" – binarnego wskaźnika (tak/nie) określającego, czy uczeń ma internet w domu.

Ponieważ dostęp do internetu może być ograniczony na terenach wiejskich, dodamy podgrupy uwzględniające miejsce zamieszkania ucznia. Posłuży nam do tego zmienna "location", która wskazuje, czy uczeń mieszka w mieście ("Urban") czy na wsi ("Rural").

Seaborn został już zaimportowany jako sns, a matplotlib.pyplot jako plt. Przypominamy, że wartości odstające w wykresach pudełkowych można ukryć, ustawiając showfliers=False.

Instrukcje

100 XP
  • Użyj sns.catplot(), aby utworzyć wykres pudełkowy na podstawie ramki danych student_data, umieszczając "internet" na osi x i "G3" na osi y.
  • Dodaj podgrupy tak, aby każdy wykres pudełkowy był kolorowany na podstawie zmiennej "location".
  • Nie wyświetlaj wartości odstających.