Einfache Zufallsstichprobe
Die einfachste Methode, eine Grundgesamtheit zu ziehen, hast du bereits gesehen. Sie heißt einfache Zufallsstichprobe (oft als „SRS“ abgekürzt) und bedeutet, Zeilen nacheinander zufällig auszuwählen, wobei jede Zeile die gleiche Chance hat, ausgewählt zu werden.
Damit du leichter sehen kannst, welche Zeilen in der Stichprobe landen, ist es hilfreich, vor dem Ziehen der Stichprobe eine Spalten-ID für die Zeilen in den Datensatz aufzunehmen.
In diesem Kapitel betrachten wir Stichprobenverfahren anhand eines synthetischen (fiktiven) Datensatzes von IBM zur Mitarbeiterfluktuation, wobei „attrition“ das Verlassen des Unternehmens bedeutet.
attrition_pop ist verfügbar; dplyr ist geladen.
Diese Übung ist Teil des Kurses
Stichprobenerhebung in R
Anleitung zur Übung
- Schau dir den Datensatz
attrition_popan. Erkunde ihn im Viewer, bis dir klar ist, was er enthält. - Setze den Zufallssamen auf einen Wert deiner Wahl.
- Füge dem Datensatz eine Zeilen-ID-Spalte hinzu und verwende dann eine einfache Zufallsstichprobe, um 200 Zeilen zu erhalten.
- Schau dir den Stichprobendatensatz
attrition_sampan. Was fällt dir an den Zeilen-IDs auf?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View the attrition_pop dataset
___
# Set the seed
___
attrition_samp <- attrition_pop %>%
# Add a row ID column
___ %>%
# Get 200 rows using simple random sampling
___
# View the attrition_samp dataset
___