1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

K-means na boisku piłkarskim

W poprzednim rozdziale używałeś(-aś) zbioru danych lineup do nauki hierarchicznego grupowania – w tym rozdziale wykorzystasz te same dane, by poznać grupowanie metodą k-means. Dla przypomnienia: ramka danych lineup zawiera pozycje 12 zawodników na początku meczu piłki nożnej w formacie 6 na 6.

Podobnie jak wcześniej, wiesz, że na boisku grają dwie drużyny. Możesz więc przeprowadzić analizę k-means z parametrem k = 2, aby określić, który zawodnik należy do której drużyny.

Zwróć uwagę, że w funkcji kmeans() wartość k podaje się za pomocą parametru centers.

Instrukcje

100 XP
  • Zbuduj model k-means o nazwie model_km2 dla zbioru danych lineup, używając funkcji kmeans() z argumentem centers = 2.
  • Wyodrębnij wektor przypisań do klastrów z modelu – model_km2$cluster – i zapisz go w zmiennej clust_km2.
  • Dodaj przypisania do klastrów jako kolumnę cluster do ramki danych lineup i zapisz wynik do nowej ramki danych o nazwie lineup_km2.
  • Użyj ggplot, aby wykreślić pozycje zawodników na boisku i pokolorować je według przynależności do klastra.