Échantillonnage simple avec pandas
Tout au long de ce chapitre, vous allez explorer des données de chansons de Spotify. Chaque ligne de l’ensemble de données de cette population représente une chanson, et il y a plus de 40 000 lignes. Les colonnes comprennent le nom de la chanson, les artistes qui l’ont interprétée, l’année de sortie et les attributs de la chanson tels que sa durée, son tempo et sa capacité à être dansée. Vous commencerez par examiner les durées.
Votre première tâche consiste à échantillonner l’ensemble de données Spotify et à comparer la durée moyenne de la population avec celle de l’échantillon.
spotify_population
est disponible et pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Sample 1000 rows from spotify_population
spotify_sample = ____
# Print the sample
print(spotify_sample)