Ces résultats sont-ils généralisables ?
Examinons un autre échantillon pour voir s’il est représentatif de la population. Cette fois, vous allez examiner la colonne duration_minutes
de l’ensemble de données Spotify, qui contient la durée de la chanson en minutes.
spotify_population
et spotify_mysterious_sample2
sont disponibles. pandas
, matplotlib.pyplot
, et numpy
sont chargés en utilisant leurs alias standard.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize the distribution of duration_minutes as a histogram
spotify_population['duration_minutes'].hist(____)
plt.show()