Comprobaciones básicas de los clústeres
En el conjunto de datos de FIFA 18, en ejercicios anteriores nos hemos centrado en los defensas. Ahora vamos a enfocarnos en los atributos de ataque de un jugador. Ritmo (pac), Regate (dri) y Tiro (sho) son características típicas de los jugadores con vocación ofensiva. En este ejercicio, ya se ha aplicado k-means a los datos usando los valores escalados de estos tres atributos. Realiza algunas comprobaciones básicas sobre los clústeres resultantes.
Los datos están almacenados en un DataFrame de pandas, fifa. Los nombres de las columnas escaladas están en una lista scaled_features. Las etiquetas de clúster se guardan en la columna cluster_labels. Recuerda que los métodos .count() y .mean() de pandas te ayudan a obtener el número de observaciones y la media de las observaciones en un DataFrame.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Instrucciones del ejercicio
- Imprime el tamaño de los clústeres agrupando por la columna
cluster_labels. - Imprime los valores medios de los salarios de los jugadores en cada clúster.
eur_wagees el nombre de la columna que almacena el salario de un jugador en euros.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print the size of the clusters
print(fifa.____(____)['ID'].count())
# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())