K-Means für Feedback-Clustering
Du hast einen Datensatz mit Feedback-Antworten und mit einem GPT-Modell Konfidenzwerte für jede Antwort berechnet. Um ungewöhnliches oder Ausreißer-Feedback zu erkennen, wendest du k-means-Clustering auf die Antworten mit niedriger Konfidenz an.
Der KMeans-Algorithmus sowie die Variablen reviews und confidences und die Bibliothek np wurden bereits geladen.
Diese Übung ist Teil des Kurses
Reinforcement Learning aus menschlichem Feedback (RLHF)
Anleitung zur Übung
- Initialisiere den k-means-Algorithmus. Setze
random_stateauf42, damit der Code reproduzierbar ist. - Berechne die Abstände zu den Clusterzentren, um Ausreißer als Differenz zwischen den
dataund den zugehörigen Clusterzentren zu identifizieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)