Método do cotovelo em grupos distintos
Vamos usar o conjunto de dados de quadrinhos para ver como fica o gráfico de cotovelo em um conjunto de dados com agrupamentos distintos e bem definidos. Talvez você queira exibir os pontos de dados antes de prosseguir com o exercício.
Os dados são armazenados em um DataFrame do pandas, comic_con
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.
Este exercício faz parte do curso
Análise de cluster em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()