1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ulepszanie wizualizacji danych w Pythonie

Connected

ćwiczenie

Gdy kategorii jest zbyt wiele

Zdarza się, że miejsce na wykresie jest ograniczone, a trzeba jednocześnie pokazać dużo danych. W tym ćwiczeniu chcesz przedstawić roczną trajektorię każdego zanieczyszczenia dla każdego miasta ze zbioru danych pollution. Każda trajektoria będzie narysowana jako linia, której wartość na osi y odpowiada odchyleniu standardowemu od średniej rocznej. Na wykresie pojawi się więc bardzo wiele linii – zdecydowanie zbyt dużo, by można je było wyraźnie odróżnić kolorem.

Aby sobie z tym poradzić, postanowiłeś(-aś) wyróżnić niewielki podzbiór kombinacji miasto–zanieczyszczenie (wanted_combos). Te kombinacje są dla ciebie najważniejsze, a pozostałe trajektorie stanowią kontekst porównawczy. Żeby skupić uwagę widza na wybranych danych, wszystkim pozostałym liniom nadasz ten sam, „neutralny" kolor.

Instrukcje

100 XP
  • Zmodyfikuj wyrażenie listowe tak, by wyodrębnić pożądane kombinacje miasta i zanieczyszczenia (wanted_combos).
  • Wskaż wykresowi liniowemu, że ma kolorować linie według nowo utworzonej kolumny color_cats w twoim DataFrame.
  • Użyj argumentu units, aby określić, w jaki sposób – czyli z której kolumny – punkty danych mają być łączone w poszczególne linie.
  • Wyłącz grupowanie punktów za pomocą argumentu estimator.