Campionamento semplice con dplyr
In tutto il capitolo esplorerai dati su brani musicali da Spotify. Ogni riga del dataset rappresenta un brano e ci sono 41656 righe. Le colonne includono il nome del brano, gli artisti che lo hanno eseguito, l’anno di uscita e attributi del brano come durata, tempo e danceability. Inizieremo guardando le durate.
Il tuo primo compito è campionare il dataset dei brani e confrontare un calcolo sull’intera popolazione e su un campione.
spotify_population è disponibile e dplyr è caricato.
Questo esercizio fa parte del corso
Campionamento in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# View the whole population dataset
___
# Sample 1000 rows from spotify_population
spotify_sample <- ___
# See the result
spotify_sample