1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w Pythonie

Connected

ćwiczenie

Podstawowe sprawdzenie klastrów

W zbiorze danych FIFA 18 poprzednie ćwiczenia koncentrowały się na obrońcach. Tym razem skupimy się na atrybutach ofensywnych zawodników. Szybkość (pac), drybling (dri) i strzał (sho) to cechy charakterystyczne dla graczy nastawionych na atak. W tym ćwiczeniu algorytm k-średnich został już zastosowany na danych z wykorzystaniem przeskalowanych wartości tych trzech atrybutów. Wykonaj podstawowe sprawdzenie utworzonych klastrów.

Dane są przechowywane w DataFrame o nazwie fifa. Nazwy przeskalowanych kolumn znajdują się na liście scaled_features. Etykiety klastrów są zapisane w kolumnie cluster_labels. Pamiętaj, że metody .count() i .mean() w pandas pozwalają obliczyć odpowiednio liczbę obserwacji oraz średnią wartość w DataFrame.

Instrukcje

100 XP
  • Wyświetl rozmiary klastrów, grupując dane według kolumny cluster_labels.
  • Wyświetl średnie wartości zarobków zawodników w każdym klastrze. eur_wage to nazwa kolumny przechowującej zarobki zawodnika w euro.