Eine Bootstrap-Verteilung erzeugen
Der Prozess zum Erzeugen einer Bootstrap-Verteilung ist dem für eine Stichprobenverteilung erstaunlich ähnlich; nur der erste Schritt ist anders.
Für eine Stichprobenverteilung startest du mit der Grundgesamtheit und ziehst ohne Zurücklegen. Für eine Bootstrap-Verteilung startest du mit einer Stichprobe und ziehst daraus mit Zurücklegen. Danach sind die Schritte identisch: Berechne die Kennzahl, die dich interessiert, auf dieser Stichprobe/Resample und wiederhole den Prozess viele Male. In beiden Fällen kannst du die Verteilung mit einem Histogramm visualisieren.
Hier ist spotify_sample eine Teilmenge des Datensatzes spotify_population. Damit du besser siehst, wie Resampling funktioniert, wurde eine Zeilen-ID-Spalte hinzugefügt, und es sind nur der Künstlername, der Songtitel und die Spalte danceability enthalten.
spotify_sample ist verfügbar; dplyr und ggplot2 sind geladen.
Diese Übung ist Teil des Kurses
<Kurs>Stichprobenerhebung in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample