FIFA 18: explorando defensores
No conjunto de dados do FIFA 18, vários atributos dos jogadores estão disponíveis. Dois desses atributos são:
- sliding tackle: um número entre 0 e 99 que indica quão preciso o jogador é ao realizar carrinhos
- aggression: um número entre 0 e 99 que indica o comprometimento e a determinação do jogador
Esses valores costumam ser altos em jogadores com foco defensivo. Neste exercício, você vai fazer clustering com base nesses atributos.
Este conjunto de dados tem 5000 linhas e é consideravelmente maior do que os anteriores. Executar o agrupamento hierárquico aqui pode levar até 10 segundos.
Os seguintes módulos já estão carregados: dendrogram, linkage, fcluster de scipy.cluster.hierarchy, matplotlib.pyplot como plt, seaborn como sns. Os dados estão em um DataFrame do pandas, fifa.
Este exercício faz parte do curso
Análise de cluster em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the data into a hierarchical clustering algorithm
distance_matrix = ____(fifa[[____, ____]], 'ward')