Ocena grupowania ziaren

W poprzednim ćwiczeniu na podstawie wykresu inercji stwierdzono, że 3 to dobra liczba klastrów dla danych o ziarnach. W rzeczywistości próbki ziaren pochodzą z mieszanki 3 różnych odmian: „Kama", „Rosa" i „Canadian". W tym ćwiczeniu podzielisz próbki ziaren na trzy klastry i porównasz je z odmianami ziaren za pomocą tabeli krzyżowej.

Dysponujesz tablicą samples z próbkami ziaren oraz listą varieties podającą odmianę ziarna dla każdej próbki. Biblioteki Pandas (pd) i KMeans zostały już zaimportowane.

Utwórz model KMeans o nazwie model z 3 klastrami.
Użyj metody .fit_predict() modelu model, aby dopasować go do samples i uzyskać etykiety klastrów. Wywołanie .fit_predict() jest równoważne z kolejnym wywołaniem .fit() i .predict().
Utwórz DataFrame df z dwiema kolumnami o nazwach 'labels' i 'varieties', używając odpowiednio labels i varieties jako wartości kolumn. Ten krok został już wykonany za ciebie.
Użyj funkcji pd.crosstab() na df['labels'] i df['varieties'], aby policzyć, ile razy każda odmiana ziarna pokrywa się z każdą etykietą klastra. Wynik przypisz do ct.
Kliknij Prześlij odpowiedź, aby zobaczyć tabelę krzyżową!

ćwiczenie

Ocena grupowania ziaren

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie