ComenzarEmpieza gratis

Análisis de muestreo por conglomerados

Tú y un grupo de psicólogos estáis interesados en analizar la salud mental de empleados. Vuestra investigación incluye una encuesta que busca medir las actitudes hacia la salud mental en el entorno tecnológico y examinar la frecuencia de trastornos de salud mental entre trabajadores del sector tech.

El conjunto de datos, mh_survey, incluye el gender de la persona encuestada, el estado de EE. UU. en el que vive, US_state_live, y si ha buscado tratamiento para su salud mental a través de su empresa, sought_treatment.

Vas a crear un gráfico de sectores para analizar la probabilidad de que una persona del sector tech en EE. UU. busque tratamiento relacionado con su salud mental, sought_treatment. Se ha cargado para ti una lista aleatoria de 10 conglomerados de estados, random_cluster.

Pandas y numpy se han importado como pd y np.

Este ejercicio forma parte del curso

Análisis de datos de encuestas en Python

Ver curso

Instrucciones del ejercicio

  • Haz un subconjunto del conjunto de datos para incluir solo los estados en random_clusters.
  • Crea un gráfico de sectores de la columna sought_treatment.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]

# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()
Editar y ejecutar código