1. Nauka
  2. /
  3. Kursy
  4. /
  5. Próbkowanie w R

Connected

ćwiczenie

Proste losowanie

Najprostszą metodą pobierania próby z populacji jest ta, którą już znasz. Nosi nazwę prostego losowania (ang. simple random sampling, w skrócie „SRS") i polega na losowym wybieraniu kolejnych wierszy, przy czym każdy wiersz ma takie samo prawdopodobieństwo wyboru jak pozostałe.

Aby łatwiej śledzić, które wiersze trafiły do próby, warto przed jej pobraniem dodać do zbioru danych kolumnę z identyfikatorami wierszy.

W tym rozdziale przyjrzymy się metodom próbkowania na podstawie syntetycznego (fikcyjnego) zbioru danych IBM dotyczącego odejść pracowników, gdzie „attrition" oznacza rezygnację z pracy.

Dostępny jest zbiór danych attrition_pop; biblioteka dplyr jest załadowana.

Instrukcje

100 XP
  • Wyświetl zbiór danych attrition_pop. Przejrzyj go w podglądzie, aż będziesz wiedzieć, co zawiera.
  • Ustaw ziarno generatora liczb losowych na wybraną przez siebie wartość.
  • Dodaj do zbioru danych kolumnę z identyfikatorami wierszy, a następnie użyj prostego losowania, aby wybrać 200 wierszy.
  • Wyświetl próbę attrition_samp. Co zauważasz w identyfikatorach wierszy?