1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

ćwiczenie

Ocena grupowania ziaren

W poprzednim ćwiczeniu na podstawie wykresu inercji stwierdzono, że 3 to dobra liczba klastrów dla danych o ziarnach. W rzeczywistości próbki ziaren pochodzą z mieszanki 3 różnych odmian: „Kama", „Rosa" i „Canadian". W tym ćwiczeniu podzielisz próbki ziaren na trzy klastry i porównasz je z odmianami ziaren za pomocą tabeli krzyżowej.

Dysponujesz tablicą samples z próbkami ziaren oraz listą varieties podającą odmianę ziarna dla każdej próbki. Biblioteki Pandas (pd) i KMeans zostały już zaimportowane.

Instrukcje

100 XP
  • Utwórz model KMeans o nazwie model z 3 klastrami.
  • Użyj metody .fit_predict() modelu model, aby dopasować go do samples i uzyskać etykiety klastrów. Wywołanie .fit_predict() jest równoważne z kolejnym wywołaniem .fit() i .predict().
  • Utwórz DataFrame df z dwiema kolumnami o nazwach 'labels' i 'varieties', używając odpowiednio labels i varieties jako wartości kolumn. Ten krok został już wykonany za ciebie.
  • Użyj funkcji pd.crosstab() na df['labels'] i df['varieties'], aby policzyć, ile razy każda odmiana ziarna pokrywa się z każdą etykietą klastra. Wynik przypisz do ct.
  • Kliknij Prześlij odpowiedź, aby zobaczyć tabelę krzyżową!