Les résultats de l’échantillon sont-ils généralisables ?
Vous venez de voir comment l’échantillonnage de commodité — collecter des données par la méthode la plus facile — peut produire des échantillons qui ne sont pas représentatifs de toute la population. Autrement dit, les conclusions tirées de l’échantillon ne sont pas généralisables à l’ensemble de la population. Visualiser les distributions de la population et de l’échantillon peut aider à déterminer si l’échantillon est représentatif de la population.
Le jeu de données Spotify contient une colonne acousticness, qui correspond à une mesure de confiance, de zéro à un, indiquant si un morceau est acoustique, c’est‑à‑dire réalisé avec des instruments non amplifiés. Ici, vous allez examiner acousticness dans la population totale de morceaux, puis dans un échantillon de ces morceaux.
spotify_population et spotify_mysterious_sample sont disponibles ; dplyr et ggplot2 sont chargés.
Cet exercice fait partie du cours
Échantillonnage en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize the distribution of acousticness as a histogram with a binwidth of 0.01
___