1. Learn
  2. /
  3. Courses
  4. /
  5. Importing and Managing Financial Data in Python

Connected

Exercise

Zvýraznění hodnot v rozdělení

Někdy je potřeba data upravit, aby bylo výsledné vizualizace přehlednější. S chybějícími hodnotami si poradí metody .dropna() a .fillna(). Odlehlé hodnoty (odchylky) pak můžeš odstranit filtrováním záznamů nad nebo pod určitým percentilem – stačí použít .quantile() na příslušný sloupec.

Ve videu jsi také viděl/a, jak v grafu zvýraznit konkrétní hodnotu přidáním svislé čáry na pozici x přes celou osu:

Axes.axvline(x=0, color=None, ...)

V tomto cvičení se ještě jednou podíváš na globální rozdělení příjmů – odstraníš odlehlé hodnoty nad 95. percentilem, vykreslíš rozdělení a zvýrazníš průměr i medián. pandas jako pd, seaborn jako sns a matplotlib.pyplot jako plt jsou již naimportovány a DataFrame income z předchozích cvičení máš k dispozici ve svém prostředí.

Instructions

100 XP
  • Přiřaď sloupec 'Income per Capita' do proměnné inc_per_capita.
  • Vyfiltruj inc_per_capita tak, aby zůstaly pouze řádky s hodnotou nižší než 95. percentil. Výsledek ulož zpět do stejné proměnné.
  • Vykresli výchozí histogram pro filtrovanou verzi inc_per_capita a výsledek přiřaď do ax.
  • Pomocí ax.axvline() s parametrem color='b' zvýrazni průměr inc_per_capita modrou barvou.
  • Pomocí ax.axvline() s parametrem color='g' zvýrazni medián zelenou barvou. Zobraz výsledek!