Tohumların farklı kümeler üzerindeki etkisi
Belirgin küme grupları olmayan bir veri kümesinde tohumların (seed) etkisini fark ettin. Bu egzersizde, kümelerin belirgin olduğu Comic Con verilerinde tohumların kümeleri etkileyip etkilemediğini inceleyeceksin.
Veri, comic_con adlı bir pandas DataFrame'inde saklanıyor. x_scaled ve y_scaled, belirli bir anda kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.
Bu egzersiz
Python ile Kümeleme Analizi
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()