Stichprobenverteilung vs. Bootstrap-Verteilung

Die Stichprobenverteilung und die Bootstrap-Verteilung hängen eng zusammen. In Situationen, in denen du wiederholt aus einer Grundgesamtheit ziehen kannst (das ist selten), und während du beide Verfahren kennenlernst, ist es hilfreich, sowohl die Stichprobenverteilung als auch die Bootstrap-Verteilung nacheinander zu erzeugen, um zu sehen, wie sie zusammenhängen.

Hier interessiert dich als Kennzahl der Mittelwert der popularity-Werte der Songs.

spotify_population (der gesamte Datensatz) und spotify_sample (nur 500 Zeilen als ursprüngliche Stichprobe) sind vorhanden; dplyr ist geladen.

Diese Übung ist Teil des Kurses

<Kurs>Stichprobenerhebung in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp

Code bearbeiten und ausführen