Distribution d’échantillonnage vs. distribution bootstrap

La distribution d’échantillonnage et la distribution bootstrap sont étroitement liées. Dans les rares situations où vous pouvez échantillonner de manière répétée à partir d’une population, et au fur et à mesure que vous apprenez ces deux notions, il est utile de générer successivement la distribution d’échantillonnage puis la distribution bootstrap pour visualiser leur relation.

Ici, la statistique qui vous intéresse est la moyenne du score de popularity des morceaux.

spotify_population (l’ensemble du jeu de données) et spotify_sample (500 lignes représentant un échantillon initial) sont disponibles ; dplyr est chargé.

Cet exercice fait partie du cours

Échantillonnage en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp

Modifier et exécuter le code