LoslegenKostenlos loslegen

Einfache Zufallsstichprobe

Die einfachste Methode, eine Grundgesamtheit zu ziehen, hast du bereits gesehen. Sie heißt einfache Zufallsstichprobe (oft als „SRS“ abgekürzt) und bedeutet, Zeilen nacheinander zufällig auszuwählen, wobei jede Zeile die gleiche Chance hat, ausgewählt zu werden.

Damit du leichter sehen kannst, welche Zeilen in der Stichprobe landen, ist es hilfreich, vor dem Ziehen der Stichprobe eine Spalten-ID für die Zeilen in den Datensatz aufzunehmen.

In diesem Kapitel betrachten wir Stichprobenverfahren anhand eines synthetischen (fiktiven) Datensatzes von IBM zur Mitarbeiterfluktuation, wobei „attrition“ das Verlassen des Unternehmens bedeutet.

attrition_pop ist verfügbar; dplyr ist geladen.

Diese Übung ist Teil des Kurses

Stichprobenerhebung in R

Kurs anzeigen

Anleitung zur Übung

  • Schau dir den Datensatz attrition_pop an. Erkunde ihn im Viewer, bis dir klar ist, was er enthält.
  • Setze den Zufallssamen auf einen Wert deiner Wahl.
  • Füge dem Datensatz eine Zeilen-ID-Spalte hinzu und verwende dann eine einfache Zufallsstichprobe, um 200 Zeilen zu erhalten.
  • Schau dir den Stichprobendatensatz attrition_samp an. Was fällt dir an den Zeilen-IDs auf?

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# View the attrition_pop dataset
___

# Set the seed
___

attrition_samp <- attrition_pop %>% 
  # Add a row ID column
  ___ %>% 
  # Get 200 rows using simple random sampling
  ___

# View the attrition_samp dataset
___
Code bearbeiten und ausführen