CommencerCommencer gratuitement

Échantillonnage simple avec pandas

Tout au long de ce chapitre, vous allez explorer des données de chansons de Spotify. Chaque ligne de l’ensemble de données de cette population représente une chanson, et il y a plus de 40 000 lignes. Les colonnes comprennent le nom de la chanson, les artistes qui l’ont interprétée, l’année de sortie et les attributs de la chanson tels que sa durée, son tempo et sa capacité à être dansée. Vous commencerez par examiner les durées.

Votre première tâche consiste à échantillonner l’ensemble de données Spotify et à comparer la durée moyenne de la population avec celle de l’échantillon.

spotify_population est disponible et pandas est chargé en tant que pd.

Cet exercice fait partie du cours

L’échantillonnage en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Sample 1000 rows from spotify_population
spotify_sample = ____

# Print the sample
print(spotify_sample)
Modifier et exécuter le code