Comprobaciones básicas de las agrupaciones
En el conjunto de datos FIFA 18, nos hemos centrado en los defensores en ejercicios anteriores. Intentemos centrarnos en los atributos ofensivos de un jugador. El ritmo (pac
), el regate (dri
) y el disparo (sho
) son características presentes en los jugadores con mentalidad ofensiva. En este ejercicio, ya se ha aplicado la agrupación de k-medias a los datos utilizando los valores escalados de estos tres atributos. Intenta realizar algunas comprobaciones básicas en las agrupaciones así formadas.
Los datos se almacenan en un DataFrame de pandas, fifa
. Los nombres escalados de las columnas se presentan en una lista scaled_features
. Las etiquetas de los grupos se almacenan en la columna cluster_labels
. Recuerda que los métodos .count()
y .mean()
de pandas te ayudan a encontrar el número de observaciones y la media de las observaciones de un DataFrame.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones de ejercicio
- Imprime el tamaño de los conglomerados agrupando la columna
cluster_labels
. - Imprime los valores medios de los salarios de los jugadores de cada grupo.
eur_wage
es el nombre de la columna que almacena el salario de un jugador en euros.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Print the size of the clusters
print(fifa.____(____)['ID'].count())
# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())