Visualize agrupamentos com matplotlib
Discutimos que as visualizações são necessárias para avaliar os grupos formados e identificar tendências em seus dados. Vamos nos concentrar agora na visualização do conjunto de dados de pegadas da Comic-Con usando o módulo matplotlib.
Os dados são armazenados em um DataFrame do pandas, comic_con. x_scaled e y_scaled são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento. cluster_labels tem os rótulos dos clusters. Um objeto de ligação é armazenado na variável distance_matrix.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções do exercício
- Importe a classe
pyplotdo módulomatplotlibcomoplt. - Defina um dicionário
colorspara dois rótulos de cluster,1e2. - Trace um gráfico de dispersão com cores para cada cluster, conforme definido pelo dicionário
colors.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the pyplot class
____
# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}
# Plot a scatter plot
comic_con.plot.scatter(x=____,
y=____,
c=comic_con['cluster_labels'].apply(____))
plt.show()