Visualiza clústeres con matplotlib
Hemos comentado que las visualizaciones son necesarias para evaluar los clústeres que se forman y detectar tendencias en tus datos. Ahora vamos a centrarnos en visualizar el conjunto de datos de afluencia de Comic-Con usando el módulo matplotlib.
Los datos están almacenados en un DataFrame de pandas, comic_con. x_scaled e y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un momento dado. cluster_labels contiene las etiquetas de clúster. Un objeto de enlace (linkage) está almacenado en la variable distance_matrix.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Instrucciones del ejercicio
- Importa la clase
pyplotdel módulomatplotlibcomoplt. - Define un diccionario
colorspara dos etiquetas de clúster,1y2. - Traza un diagrama de dispersión con colores para cada clúster tal como define el diccionario
colors.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()