Geri bildirim kümeleme için K-means
Elinde geri bildirim yanıtlarından oluşan bir veri kümesi var ve her yanıt için bir GPT modeliyle güven puanları hesapladın. Sıradışı veya aykırı geri bildirimleri belirlemek için, düşük güven puanlı yanıtlara k-means kümeleme uyguluyorsun.
KMeans algoritması, reviews ve confidences değişkenleri ile np kütüphanesi önceden yüklendi.
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırEgzersiz talimatları
- K-means algoritmasını başlat. Kodun tekrarlanabilir olması için
random_statedeğerini42olarak ayarla. - Aykırı değerleri belirlemek için, küme merkezlerinden uzaklıkları
dataile ilgili küme merkezleri arasındaki fark üzerinden hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)