Tohumların farklı kümeler üzerindeki etkisi
Belirgin küme grupları olmayan bir veri kümesinde tohumların (seed) etkisini fark ettin. Bu egzersizde, kümelerin belirgin olduğu Comic Con verilerinde tohumların kümeleri etkileyip etkilemediğini inceleyeceksin.
Veri, comic_con adlı bir pandas DataFrame'inde saklanıyor. x_scaled ve y_scaled, belirli bir anda kişilerin standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.
Bu egzersiz, kursun bir parçasıdır
Python ile Kümeleme Analizi
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()