1. Nauka
  2. /
  3. Kursy
  4. /
  5. Próbkowanie w Pythonie

Connected

ćwiczenie

Czy próbkowanie systematyczne jest właściwe?

Próbkowanie systematyczne ma pewną wadę: jeśli dane są posortowane lub kolejność wierszy wynika z jakiegoś wzorca albo niesie ze sobą określone znaczenie, otrzymana próba może nie być reprezentatywna dla całej populacji. Problem można rozwiązać, mieszając wiersze – jednak wtedy próbkowanie systematyczne staje się równoważne prostemu losowaniu.

W tym ćwiczeniu sprawdzisz, jak wykryć, czy taki problem występuje.

Dostępny jest zbiór attrition_pop; biblioteka pandas jest załadowana jako pd, a matplotlib.pyplot jako plt.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Dodaj kolumnę indeksu do attrition_pop, zapisując wynik jako attrition_pop_id.
  • Utwórz wykres punktowy YearsAtCompany względem index dla attrition_pop_id, używając metody .plot() z pandas.