ComenzarEmpieza gratis

Comprobaciones básicas de los clústeres

En el conjunto de datos de FIFA 18, en ejercicios anteriores nos hemos centrado en los defensas. Ahora vamos a enfocarnos en los atributos de ataque de un jugador. Ritmo (pac), Regate (dri) y Tiro (sho) son características típicas de los jugadores con vocación ofensiva. En este ejercicio, ya se ha aplicado k-means a los datos usando los valores escalados de estos tres atributos. Realiza algunas comprobaciones básicas sobre los clústeres resultantes.

Los datos están almacenados en un DataFrame de pandas, fifa. Los nombres de las columnas escaladas están en una lista scaled_features. Las etiquetas de clúster se guardan en la columna cluster_labels. Recuerda que los métodos .count() y .mean() de pandas te ayudan a obtener el número de observaciones y la media de las observaciones en un DataFrame.

Este ejercicio forma parte del curso

Análisis de clústeres en Python

Ver curso

Instrucciones del ejercicio

  • Imprime el tamaño de los clústeres agrupando por la columna cluster_labels.
  • Imprime los valores medios de los salarios de los jugadores en cada clúster. eur_wage es el nombre de la columna que almacena el salario de un jugador en euros.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print the size of the clusters
print(fifa.____(____)['ID'].count())

# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())
Editar y ejecutar código