Eine Bootstrap-Verteilung erzeugen
Der Prozess zum Erzeugen einer Bootstrap-Verteilung ist dem für eine Stichprobenverteilung erstaunlich ähnlich; nur der erste Schritt ist anders.
Für eine Stichprobenverteilung startest du mit der Grundgesamtheit und ziehst ohne Zurücklegen. Für eine Bootstrap-Verteilung startest du mit einer Stichprobe und ziehst daraus mit Zurücklegen. Danach sind die Schritte identisch: Berechne die Kennzahl, die dich interessiert, auf dieser Stichprobe/Resample und wiederhole den Prozess viele Male. In beiden Fällen kannst du die Verteilung mit einem Histogramm visualisieren.
Hier ist spotify_sample eine Teilmenge des Datensatzes spotify_population. Damit du besser siehst, wie Resampling funktioniert, wurde eine Zeilen-ID-Spalte hinzugefügt, und es sind nur der Künstlername, der Songtitel und die Spalte danceability enthalten.
spotify_sample ist verfügbar; dplyr und ggplot2 sind geladen.
Diese Übung ist Teil des Kurses
Stichprobenerhebung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample