Verifiche di base sui cluster
Nel dataset di FIFA 18, negli esercizi precedenti ci siamo concentrati sui difensori. Proviamo ora a focalizzarci sugli attributi offensivi di un giocatore. Velocità (pac), Dribbling (dri) e Tiro (sho) sono caratteristiche tipiche dei giocatori con mentalità offensiva. In questo esercizio, il clustering k-means è già stato applicato ai dati usando i valori scalati di questi tre attributi. Esegui alcune verifiche di base sui cluster così ottenuti.
I dati sono salvati in un DataFrame pandas, fifa. I nomi delle colonne scalate sono presenti in una lista scaled_features. Le etichette dei cluster sono archiviate nella colonna cluster_labels. Ricorda che i metodi .count() e .mean() in pandas ti aiutano a trovare rispettivamente il numero di osservazioni e la media delle osservazioni in un DataFrame.
Questo esercizio fa parte del corso
Analisi di cluster in Python
Istruzioni dell'esercizio
- Stampa la dimensione dei cluster raggruppando per la colonna
cluster_labels. - Stampa i valori medi degli stipendi dei giocatori in ciascun cluster.
eur_wageè il nome della colonna che memorizza lo stipendio di un giocatore in euro.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the size of the clusters
print(fifa.____(____)['ID'].count())
# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())