Análisis de muestreo por conglomerados
Tú y un grupo de psicólogos estáis interesados en analizar la salud mental de empleados. Vuestra investigación incluye una encuesta que busca medir las actitudes hacia la salud mental en el entorno tecnológico y examinar la frecuencia de trastornos de salud mental entre trabajadores del sector tech.
El conjunto de datos, mh_survey, incluye el gender de la persona encuestada, el estado de EE. UU. en el que vive, US_state_live, y si ha buscado tratamiento para su salud mental a través de su empresa, sought_treatment.
Vas a crear un gráfico de sectores para analizar la probabilidad de que una persona del sector tech en EE. UU. busque tratamiento relacionado con su salud mental, sought_treatment.
Se ha cargado para ti una lista aleatoria de 10 conglomerados de estados, random_cluster.
Pandas y numpy se han importado como pd y np.
Este ejercicio forma parte del curso
Análisis de datos de encuestas en Python
Instrucciones del ejercicio
- Haz un subconjunto del conjunto de datos para incluir solo los estados en
random_clusters. - Crea un gráfico de sectores de la columna
sought_treatment.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]
# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()