1. Nauka
  2. /
  3. Kursy
  4. /
  5. Symulacje Monte Carlo w Pythonie

Connected

ćwiczenie

Eksploracja za pomocą wykresów pudełkowych

Ramki danych mogą być przechowywane w dwóch popularnych formatach: szerokim i długim. Format szeroki przedstawia różne zmienne w oddzielnych kolumnach, natomiast format długi koduje zmienne za pomocą dwóch kolumn – jednej zawierającej nazwy zmiennych i drugiej przechowującej odpowiadające im wartości.

Format długi bywa bardzo przydatny przy tworzeniu różnych wizualizacji. W tym ćwiczeniu najpierw przekonwertujesz ramkę danych df_diffs (już wczytaną) z formatu szerokiego na długi, a następnie użyjesz jej do stworzenia wykresu pudełkowego.

Biblioteka pandas jest dostępna jako pd, matplotlib.pyplot jako plt, a Seaborn jako sns.

Instrukcje

100 XP
  • Przekonwertuj kolumny bmi i hdl (w tej kolejności) z ramki danych df_diffs z formatu szerokiego na długi; zapisz wynikową ramkę danych jako hdl_bmi_long i nadaj kolumnie wartości zmiennych nazwę y_diff.
  • Użyj wykresu pudełkowego, aby zwizualizować wyniki pacjentów z pierwszego lub ostatniego kwartylu zmiennych hdl i bmi.