Metode elbow pada data seragam
Pada latihan sebelumnya, Anda membuat plot elbow pada data dengan klaster yang terdefinisi jelas. Sekarang, mari kita lihat seperti apa plot elbow pada himpunan data dengan titik yang terdistribusi seragam. Anda mungkin ingin menampilkan titik data terlebih dahulu sebelum melanjutkan latihan.
Data disimpan dalam pandas DataFrame, uniform_data. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari titik-titik tersebut.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
distortions = []
num_clusters = range(2, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
____.append(____)
# Create a DataFrame with two lists - number of clusters and distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.____(x=____, y=____, data=____)
plt.xticks(num_clusters)
plt.show()