Tahıl kümelemesini değerlendirme
Önceki egzersizde, ataletsel grafikten tahıl verisi için 3 kümenin iyi bir sayı olduğunu gözlemledin. Aslında tahıl örnekleri, "Kama", "Rosa" ve "Canadian" olmak üzere 3 farklı tahıl çeşidinin karışımından geliyor. Bu egzersizde, tahıl örneklerini üç kümeye ayır ve kümeleri tahıl çeşitleriyle bir çapraz tablo kullanarak karşılaştır.
Elinde tahıl örneklerinden oluşan samples dizisi ve her örnek için tahıl çeşidini veren varieties listesi var. Pandas (pd) ve KMeans senin için zaten içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
Python'da Unsupervised Learning
Egzersiz talimatları
3kümelimodeladlı birKMeansmodeli oluştur.modelin.fit_predict()metodunu kullanarak modelisamplesüzerinde eğit ve küme etiketlerini elde et..fit_predict()kullanmak,.fit()ardından.predict()kullanmakla aynıdır.- Sütun değerleri olarak sırasıyla
labelsvevarietieskullanarak,'labels've'varieties'adlı iki sütunlu birdfDataFrame'i oluştur. Bu senin için yapıldı. - Her bir tahıl çeşidinin her bir küme etiketiyle kaç kez çakıştığını saymak için
df['labels']vedf['varieties']üzerindepd.crosstab()fonksiyonunu kullan. Sonucuctdeğişkenine ata. - Çapraz tabloyu görmek için Yanıtı Gönder!
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a KMeans model with 3 clusters: model
model = ____
# Use fit_predict to fit model and obtain cluster labels: labels
labels = ____
# Create a DataFrame with labels and varieties as columns: df
df = pd.DataFrame({'labels': labels, 'varieties': varieties})
# Create crosstab: ct
ct = ____
# Display ct
print(ct)