Tahıl kümelemesini değerlendirme
Önceki egzersizde, ataletsel grafikten tahıl verisi için 3 kümenin iyi bir sayı olduğunu gözlemledin. Aslında tahıl örnekleri, "Kama", "Rosa" ve "Canadian" olmak üzere 3 farklı tahıl çeşidinin karışımından geliyor. Bu egzersizde, tahıl örneklerini üç kümeye ayır ve kümeleri tahıl çeşitleriyle bir çapraz tablo kullanarak karşılaştır.
Elinde tahıl örneklerinden oluşan samples dizisi ve her örnek için tahıl çeşidini veren varieties listesi var. Pandas (pd) ve KMeans senin için zaten içe aktarıldı.
Bu egzersiz
Python'da Unsupervised Learning
kursunun bir parçasıdırEgzersiz talimatları
3kümelimodeladlı birKMeansmodeli oluştur.modelin.fit_predict()metodunu kullanarak modelisamplesüzerinde eğit ve küme etiketlerini elde et..fit_predict()kullanmak,.fit()ardından.predict()kullanmakla aynıdır.- Sütun değerleri olarak sırasıyla
labelsvevarietieskullanarak,'labels've'varieties'adlı iki sütunlu birdfDataFrame'i oluştur. Bu senin için yapıldı. - Her bir tahıl çeşidinin her bir küme etiketiyle kaç kez çakıştığını saymak için
df['labels']vedf['varieties']üzerindepd.crosstab()fonksiyonunu kullan. Sonucuctdeğişkenine ata. - Çapraz tabloyu görmek için Yanıtı Gönder!
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a KMeans model with 3 clusters: model
model = ____
# Use fit_predict to fit model and obtain cluster labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)