1. Nauka
  2. /
  3. Kursy
  4. /
  5. Próbkowanie w Pythonie

Connected

ćwiczenie

3 rodzaje próbkowania

Porównasz teraz skuteczność estymatorów punktowych dla próbkowania prostego, warstwowego i skupień. Najpierw musisz jednak przygotować odpowiednie próbki.

Skorzystasz z kolumny RelationshipSatisfaction ze zbioru danych attrition_pop, która opisuje poziom satysfakcji pracownika z relacji w firmie. Kolumna przyjmuje cztery wartości: Low, Medium, High i Very_High. Biblioteka pandas została załadowana pod zwykłym aliasem, a pakiet random jest już dostępny.

Instrukcje 1/3

undefined XP
  • 1
    • Wykonaj proste losowanie próby ze zbioru attrition_pop, pobierając jedną czwartą populacji. Ustaw ziarno losowości na 2022.
  • 2
    • Wykonaj próbkowanie warstwowe na zbiorze attrition_pop, pobierając jedną czwartą obserwacji z każdej grupy RelationshipSatisfaction. Ustaw ziarno losowości na 2022.
  • 3
    • Utwórz listę unikalnych wartości z kolumny RelationshipSatisfaction zbioru attrition_pop.
    • Wylosuj ze zbioru satisfaction_unique dwie wartości.
    • Przefiltruj populację, zachowując wiersze, w których RelationshipSatisfaction należy do satisfaction_samp, i usuń nieużywane kategorie z kolumny RelationshipSatisfaction; przypisz wynik do attrition_clust_prep.
    • Wykonaj próbkowanie skupień na wybranych grupach satysfakcji, pobierając jedną czwartą populacji i ustawiając ziarno losowości na 2022.