¿Se pueden generalizar los hallazgos de la muestra?
Acabas de ver cómo el muestreo por conveniencia —recoger datos por el método más fácil— puede dar lugar a muestras que no representan a toda la población. En consecuencia, los hallazgos de la muestra no son generalizables a la población completa. Visualizar las distribuciones de la población y de la muestra puede ayudarte a decidir si la muestra es representativa de la población.
El conjunto de datos de Spotify incluye una columna llamada acousticness, que es una medida de confianza de cero a uno sobre si una pista es acústica, es decir, si se creó con instrumentos que no están conectados. Aquí, vas a analizar acousticness en la población total de canciones y en una muestra de esas canciones.
spotify_population y spotify_mysterious_sample están disponibles; dplyr y ggplot2 están cargados.
Este ejercicio forma parte del curso
Muestreo en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Visualize the distribution of acousticness as a histogram with a binwidth of 0.01
___