Avistamientos de Pokémon: clustering con k-means
Vamos a continuar la investigación sobre los avistamientos de Pokémon legendarios del ejercicio anterior. Igual que antes, usaremos el mismo ejemplo de avistamientos de Pokémon. En este ejercicio, formarás clústeres de los avistamientos usando clustering con k-means.
x e y son columnas con las coordenadas X e Y de las ubicaciones de los avistamientos, almacenadas en un DataFrame de pandas, df. Tienes disponibles para usar: matplotlib.pyplot como plt, seaborn como sns y pandas como pd.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Instrucciones del ejercicio
- Importa las funciones
kmeansyvq. - Usa la función
kmeans()para calcular los centros de clúster definiendo dos clústeres. - Asigna etiquetas de clúster a cada punto de datos usando la función
vq(). - Representa los puntos con seaborn y asigna un color distinto a cada clúster.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import kmeans and vq functions
from scipy.cluster.vq import ____, ____
# Compute cluster centers
centroids,_ = ____(____, ____)
# Assign cluster labels
df['cluster_labels'], _ = ____(____, ____)
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()