Campionamento semplice con pandas

In tutto il capitolo esplorerai i dati delle canzoni da Spotify. Ogni riga di questo insieme di dati della popolazione rappresenta una canzone, e ci sono più di 40.000 righe. Le colonne includono il titolo della canzone, gli artisti che l'hanno eseguita, l'anno di uscita e attributi della canzone come durata, tempo e danceability. Inizierai guardando le durate.

Il tuo primo compito è campionare il dataset di Spotify e confrontare la durata media della popolazione con quella del campione.

spotify_population è disponibile e pandas è caricato come pd.

Questo esercizio fa parte del corso

Campionamento in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Sample 1000 rows from spotify_population
spotify_sample = ____

# Print the sample
print(spotify_sample)

Modifica ed esegui il codice