ARI ile kümelemede özellik önemi
Önceki egzersizde çalıştığın ve X içinde önceden yüklenmiş olan müşteri veri kümesinde, her özelliğin kaldırılmasının küme atamalarına etkisini nicel olarak ölçmek için Adjusted Rand Index (ARI) metriğinden yararlan.
adjusted_rand_score() fonksiyonu ve column_names değişkeni senin için önceden yüklendi.
Bu egzersiz
Python ile Açıklanabilir AI
kursunun bir parçasıdırEgzersiz talimatları
original_clustersiçinde orijinal küme atamalarını türet.- For döngüsünde özellikleri teker teker kaldır ve sonucu
X_reducediçinde sakla. - K-means'i
X_reducedüzerinde uygulayarakreduced_clusters'ı elde et. reduced_clustersileoriginal_clustersarasındaki ARI'ya göre özellikimportancedeğerini hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
# Derive reduced clusters
reduced_clusters = ____
# Derive feature importance
importance = ____
print(f'{column_names[i]}: {importance}')