ComeçarComece gratuitamente

Visualize agrupamentos com matplotlib

Discutimos que as visualizações são necessárias para avaliar os grupos formados e identificar tendências em seus dados. Vamos nos concentrar agora na visualização do conjunto de dados de pegadas da Comic-Con usando o módulo matplotlib.

Os dados são armazenados em um DataFrame do pandas, comic_con. x_scaled e y_scaled são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento. cluster_labels tem os rótulos dos clusters. Um objeto de ligação é armazenado na variável distance_matrix.

Este exercício faz parte do curso

Análise de cluster em Python

Ver Curso

Instruções de exercício

  • Importe a classe pyplot do módulo matplotlib como plt.
  • Defina um dicionário colors para dois rótulos de cluster, 1 e 2.
  • Trace um gráfico de dispersão com cores para cada cluster, conforme definido pelo dicionário colors.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import the pyplot class
____

# Define a colors dictionary for clusters
colors = {____:'red', ____:'blue'}

# Plot a scatter plot
comic_con.plot.scatter(x=____, 
                	   y=____,
                	   c=comic_con['cluster_labels'].apply(____))
plt.show()
Editar e executar código