1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Monte Carlo simulace v Pythonu

Connected

cvičení

Průzkum dat pomocí boxplotů

DataFramy se běžně vyskytují ve dvou formátech: širokém a dlouhém. Široký formát reprezentuje různé proměnné v samostatných sloupcích, zatímco dlouhý formát je vyjadřuje pomocí dvou sloupců dohromady – jeden pro název proměnné a druhý pro odpovídající hodnoty.

Dlouhý formát DataFramu se hodí pro snadné vytváření různých vizualizací, včetně boxplotu, který v tomto cvičení vytvoříš po převedení df_diffs (načteno za tebe) ze širokého na dlouhý formát.

pandas je načteno jako pd, matplotlib.pyplot jako plt a Seaborn jako sns.

Pokyny

100 XP
  • Převeď sloupce bmi a hdl (v tomto pořadí) z DataFramu df_diffs ze širokého na dlouhý formát; výsledný DataFrame ulož jako hdl_bmi_long a sloupci s hodnotami proměnných dej název y_diff.
  • Pomocí boxplotu vizualizuj výsledky pacientů v prvním nebo posledním kvartilu proměnných hdl a bmi.