ComenzarEmpieza gratis

Visualizar conglomerados con matplotlib

Hemos hablado de que las visualizaciones son necesarias para evaluar las agrupaciones que se forman y detectar tendencias en tus datos. Centrémonos ahora en la visualización del conjunto de datos de pisadas de la Comic-Con utilizando el módulo matplotlib.

Los datos se almacenan en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado. cluster_labels tiene las etiquetas de los conglomerados. Un objeto de enlace se almacena en la variable distance_matrix.

Este ejercicio forma parte del curso

Análisis de conglomerados en Python

Ver curso

Instrucciones de ejercicio

  • Importa la clase pyplot del módulo matplotlib como plt.
  • Define un diccionario colors para dos etiquetas de grupo, 1 y 2.
  • Traza un diagrama de dispersión con colores para cada conglomerado, tal y como se define en el diccionario colors.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Editar y ejecutar código