CommencerCommencez gratuitement

Ces résultats sont-ils généralisables ?

Examinons un autre échantillon pour voir s’il est représentatif de la population. Cette fois, vous allez examiner la colonne duration_minutes de l’ensemble de données Spotify, qui contient la durée de la chanson en minutes.

spotify_population et spotify_mysterious_sample2 sont disponibles. pandas, matplotlib.pyplot, et numpy sont chargés en utilisant leurs alias standard.

Cet exercice fait partie du cours

<cours>L’échantillonnage en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Visualize the distribution of duration_minutes as a histogram
spotify_population['duration_minutes'].hist(____)
plt.show()
Modifier et exécuter le code