Método del codo en clústeres bien definidos
Usemos el conjunto de datos de la comic con para ver cómo se ve la gráfica del codo en un conjunto con clústeres distintos y bien definidos. Puede que quieras visualizar los puntos antes de continuar con el ejercicio.
Los datos están en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()