CommencerCommencer gratuitement

Générer une distribution bootstrap

Le processus pour générer une distribution bootstrap ressemble étonnamment à celui pour générer une distribution d’échantillonnage ; seule la première étape change.

Pour créer une distribution d’échantillonnage, vous partez de la population et échantillonnez sans remise. Pour créer une distribution bootstrap, vous partez d’un échantillon et vous ré-échantillonnez avec remise. Ensuite, les étapes sont identiques : calculez la statistique de synthèse qui vous intéresse sur cet échantillon/rééchantillon, puis répétez l’opération de nombreuses fois. Dans les deux cas, vous pouvez visualiser la distribution avec un histogramme.

Ici, spotify_sample est un sous-ensemble du jeu de données spotify_population. Pour faciliter la compréhension du rééchantillonnage, une colonne d’identifiant de ligne a été ajoutée, et seules les colonnes nom de l’artiste, nom du morceau et danceability ont été conservées.

spotify_sample est disponible ; dplyr et ggplot2 sont chargés.

Cet exercice fait partie du cours

Échantillonnage en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate 1 bootstrap resample
spotify_1_resample <- ___


# See the result
spotify_1_resample
Modifier et exécuter le code