¿Son generalizables las conclusiones de la muestra?
Acabas de ver cómo el muestreo de conveniencia (recoger datos utilizando el método más fácil) puede dar lugar a muestras que no son representativas de la población. Equivalentemente, esto significa que las conclusiones de la muestra no son generalizables a la población. Visualizar las distribuciones de la población y la muestra puede ayudar a determinar si la muestra es o no representativa de la población.
El conjunto de datos de Spotify contiene una columna acousticness
, que es una medida de confianza de cero a uno de si la canción se hizo con instrumentos que no están enchufados. Compararás la distribución acousticness
de la población total de canciones con una muestra de esas canciones.
spotify_population
y spotify_mysterious_sample
están disponibles; se cargan pandas
como pd
, matplotlib.pyplot
como plt
, y numpy
como np
.
Este ejercicio forma parte del curso
Muestreo en Python
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Visualize the distribution of acousticness with a histogram
____
plt.show()