Método del codo en grupos distintos
Utilicemos el conjunto de datos de los cómics para ver qué aspecto tiene el gráfico de codo en un conjunto de datos con conglomerados distintos y bien definidos. Puede que quieras visualizar los puntos de datos antes de continuar con el ejercicio.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()