ComeçarComece de graça

Verificações básicas em clusters

No conjunto de dados FIFA 18, nos concentramos nos defensores em exercícios anteriores. Vamos tentar nos concentrar nos atributos de ataque de um jogador. A velocidade (pac), o drible (dri) e o chute (sho) são características presentes em jogadores com mentalidade de ataque. Neste exercício, o agrupamento k-means já foi aplicado aos dados usando os valores em escala desses três atributos. Tente fazer algumas verificações básicas nos clusters assim formados.

Os dados são armazenados em um DataFrame da pandas, fifa. Os nomes das colunas em escala estão presentes em uma lista scaled_features. Os rótulos de cluster são armazenados na coluna cluster_labels. Lembre-se de que os métodos .count() e .mean() do pandas ajudam você a encontrar o número de observações e a média das observações em um DataFrame.

Este exercício faz parte do curso

Análise de cluster em Python

Ver curso

Instruções do exercício

  • Imprima o tamanho dos clusters agrupando a coluna cluster_labels.
  • Imprima os valores médios dos salários dos jogadores em cada cluster. eur_wage é o nome da coluna que armazena os salários de um jogador em euros.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print the size of the clusters
print(fifa.____(____)['ID'].count())

# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())
Editar e executar o código