IniziaInizia gratis

Campionamento semplice con dplyr

In tutto il capitolo esplorerai dati su brani musicali da Spotify. Ogni riga del dataset rappresenta un brano e ci sono 41656 righe. Le colonne includono il nome del brano, gli artisti che lo hanno eseguito, l’anno di uscita e attributi del brano come durata, tempo e danceability. Inizieremo guardando le durate.

Il tuo primo compito è campionare il dataset dei brani e confrontare un calcolo sull’intera popolazione e su un campione.

spotify_population è disponibile e dplyr è caricato.

Questo esercizio fa parte del corso

Campionamento in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample
Modifica ed esegui il codice