Penampakan Pokémon: hierarchical clustering
Kita akan melanjutkan penyelidikan terhadap penampakan Pokémon legendaris dari latihan sebelumnya. Ingat bahwa pada scatter plot di latihan sebelumnya, Anda mengidentifikasi dua area dengan kepadatan penampakan Pokémon yang tinggi. Ini berarti titik-titik tampak terbagi menjadi dua klaster. Pada latihan ini, Anda akan membentuk dua klaster dari data penampakan menggunakan hierarchical clustering.
'x' dan 'y' adalah kolom berisi koordinat X dan Y dari lokasi penampakan, disimpan dalam pandas DataFrame, df. Berikut ini tersedia untuk digunakan: matplotlib.pyplot sebagai plt, seaborn sebagai sns, dan pandas sebagai pd.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Petunjuk latihan
- Impor pustaka
linkagedanfcluster. - Gunakan fungsi
linkage()untuk menghitung jarak menggunakan metode ward. - Hasilkan label klaster untuk tiap titik data dengan dua klaster menggunakan fungsi
fcluster(). - Plot titik-titik dengan seaborn dan tetapkan warna berbeda untuk tiap klaster.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import linkage and fcluster functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function to compute distance
Z = ____(____, 'ward')
# Generate cluster labels
df['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()