MulaiMulai sekarang secara gratis

K-means untuk pengelompokan umpan balik

Anda memiliki himpunan data berisi respons umpan balik, dan Anda telah menggunakan model GPT untuk menghitung skor keyakinan untuk setiap respons. Untuk mengidentifikasi umpan balik yang tidak biasa atau outlier, Anda menerapkan pengelompokan k-means pada respons dengan keyakinan rendah.

Algoritma KMeans, variabel reviews dan confidences, serta pustaka np telah dimuat sebelumnya.

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Petunjuk latihan

  • Inisialisasi algoritma k-means. Atur random_state ke 42 untuk reprodusibilitas kode.
  • Hitung jarak dari pusat klaster untuk mengidentifikasi outlier sebagai selisih antara data dan pusat klaster yang bersesuaian.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def detect_anomalies(data, n_clusters=3):
    # Initialize k-means
    ____
    clusters = kmeans.fit_predict(data)
    centers = kmeans.cluster_centers_

    # Calculate distances from cluster centers
    ____
    return distances
  
anomalies = detect_anomalies(confidences)
print(anomalies)
Edit dan Jalankan Kode