Campionamento semplice con pandas
In tutto il capitolo esplorerai i dati delle canzoni da Spotify. Ogni riga di questo insieme di dati della popolazione rappresenta una canzone, e ci sono più di 40.000 righe. Le colonne includono il titolo della canzone, gli artisti che l'hanno eseguita, l'anno di uscita e attributi della canzone come durata, tempo e danceability. Inizierai guardando le durate.
Il tuo primo compito è campionare il dataset di Spotify e confrontare la durata media della popolazione con quella del campione.
spotify_population è disponibile e pandas è caricato come pd.
Questo esercizio fa parte del corso
Campionamento in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Sample 1000 rows from spotify_population
spotify_sample = ____
# Print the sample
print(spotify_sample)