Visualizar conglomerados con matplotlib
Hemos hablado de que las visualizaciones son necesarias para evaluar las agrupaciones que se forman y detectar tendencias en tus datos. Centrémonos ahora en la visualización del conjunto de datos de pisadas de la Comic-Con utilizando el módulo matplotlib
.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado. cluster_labels
tiene las etiquetas de los conglomerados. Un objeto de enlace se almacena en la variable distance_matrix
.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones de ejercicio
- Importa la clase
pyplot
del módulomatplotlib
comoplt
. - Define un diccionario
colors
para dos etiquetas de grupo,1
y2
. - Traza un diagrama de dispersión con colores para cada conglomerado, tal y como se define en el diccionario
colors
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()