K-means untuk pengelompokan umpan balik
Anda memiliki himpunan data berisi respons umpan balik, dan Anda telah menggunakan model GPT untuk menghitung skor keyakinan untuk setiap respons. Untuk mengidentifikasi umpan balik yang tidak biasa atau outlier, Anda menerapkan pengelompokan k-means pada respons dengan keyakinan rendah.
Algoritma KMeans, variabel reviews dan confidences, serta pustaka np telah dimuat sebelumnya.
Latihan ini merupakan bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Instruksi latihan
- Inisialisasi algoritma k-means. Atur
random_stateke42untuk reprodusibilitas kode. - Hitung jarak dari pusat klaster untuk mengidentifikasi outlier sebagai selisih antara
datadan pusat klaster yang bersesuaian.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)