1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracyjna analiza danych w Pythonie

Connected

ćwiczenie

Eksploracja za pomocą wykresów KDE

Wykresy KDE (Kernel Density Estimate – estymata jądrowa gęstości) to świetna alternatywa dla histogramów, gdy chcesz pokazać wiele rozkładów na jednym wykresie.

Załóżmy, że interesuje cię zależność między długością małżeństwa a liczbą dzieci w danym związku. Ponieważ wartości w kolumnie num_kids mieszczą się w przedziale od jednego do pięciu, możesz narysować KDE dla każdej wartości na tym samym wykresie.

Zbiór danych divorce jest już wczytany. Biblioteka pandas jest dostępna jako pd, matplotlib.pyplot jako plt, a Seaborn jako sns. Pamiętaj, że kolumna num_kids w zbiorze divorce zawiera wyłącznie wartości N/A dla par bezdzietnych – dlatego analizowane będą tylko rozkłady dla par, które mają co najmniej jedno dziecko.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Utwórz wykres KDE, na którym oś x przedstawia marriage_duration, a każda możliwa liczba dzieci reprezentowana przez num_kids jest zaznaczona osobną, kolorową linią.