I risultati del campione sono generalizzabili?
Hai appena visto come il convenience sampling — raccogliere dati con il metodo più semplice — possa produrre campioni non rappresentativi dell’intera popolazione. In altre parole, significa che i risultati ottenuti dal campione non sono generalizzabili all’intera popolazione. Visualizzare le distribuzioni della popolazione e del campione può aiutarti a capire se il campione è o meno rappresentativo della popolazione.
Il dataset di Spotify contiene una colonna chiamata acousticness, una misura di confidenza da zero a uno che indica se il brano è acustico, cioè creato con strumenti non amplificati. Qui esaminerai l’acousticness nell’intera popolazione di brani e in un campione di quei brani.
spotify_population e spotify_mysterious_sample sono disponibili; dplyr e ggplot2 sono caricati.
Questo esercizio fa parte del corso
Campionamento in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Visualize the distribution of acousticness as a histogram with a binwidth of 0.01
___