Visualize agrupamentos com matplotlib
Discutimos que as visualizações são necessárias para avaliar os grupos formados e identificar tendências em seus dados. Vamos nos concentrar agora na visualização do conjunto de dados de pegadas da Comic-Con usando o módulo matplotlib
.
Os dados são armazenados em um DataFrame do pandas, comic_con
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento. cluster_labels
tem os rótulos dos clusters. Um objeto de ligação é armazenado na variável distance_matrix
.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções de exercício
- Importe a classe
pyplot
do módulomatplotlib
comoplt
. - Defina um dicionário
colors
para dois rótulos de cluster,1
e2
. - Trace um gráfico de dispersão com cores para cada cluster, conforme definido pelo dicionário
colors
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()