LoslegenKostenlos starten

K-Means für Feedback-Clustering

Du hast einen Datensatz mit Feedback-Antworten und mit einem GPT-Modell Konfidenzwerte für jede Antwort berechnet. Um ungewöhnliches oder Ausreißer-Feedback zu erkennen, wendest du k-means-Clustering auf die Antworten mit niedriger Konfidenz an.

Der KMeans-Algorithmus sowie die Variablen reviews und confidences und die Bibliothek np wurden bereits geladen.

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>
Kurs ansehen

Übungsanweisungen

  • Initialisiere den k-means-Algorithmus. Setze random_state auf 42, damit der Code reproduzierbar ist.
  • Berechne die Abstände zu den Clusterzentren, um Ausreißer als Differenz zwischen den data und den zugehörigen Clusterzentren zu identifizieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def detect_anomalies(data, n_clusters=3):
    # Initialize k-means
    ____
    clusters = kmeans.fit_predict(data)
    centers = kmeans.cluster_centers_

    # Calculate distances from cluster centers
    ____
    return distances
  
anomalies = detect_anomalies(confidences)
print(anomalies)
Code bearbeiten und ausführen