LoslegenKostenlos loslegen

K-Means für Feedback-Clustering

Du hast einen Datensatz mit Feedback-Antworten und mit einem GPT-Modell Konfidenzwerte für jede Antwort berechnet. Um ungewöhnliches oder Ausreißer-Feedback zu erkennen, wendest du k-means-Clustering auf die Antworten mit niedriger Konfidenz an.

Der KMeans-Algorithmus sowie die Variablen reviews und confidences und die Bibliothek np wurden bereits geladen.

Diese Übung ist Teil des Kurses

Reinforcement Learning aus menschlichem Feedback (RLHF)

Kurs anzeigen

Anleitung zur Übung

  • Initialisiere den k-means-Algorithmus. Setze random_state auf 42, damit der Code reproduzierbar ist.
  • Berechne die Abstände zu den Clusterzentren, um Ausreißer als Differenz zwischen den data und den zugehörigen Clusterzentren zu identifizieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def detect_anomalies(data, n_clusters=3):
    # Initialize k-means
    ____
    clusters = kmeans.fit_predict(data)
    centers = kmeans.cluster_centers_

    # Calculate distances from cluster centers
    ____
    return distances
  
anomalies = detect_anomalies(confidences)
print(anomalies)
Code bearbeiten und ausführen