K-Means für Feedback-Clustering
Du hast einen Datensatz mit Feedback-Antworten und mit einem GPT-Modell Konfidenzwerte für jede Antwort berechnet. Um ungewöhnliches oder Ausreißer-Feedback zu erkennen, wendest du k-means-Clustering auf die Antworten mit niedriger Konfidenz an.
Der KMeans-Algorithmus sowie die Variablen reviews und confidences und die Bibliothek np wurden bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>Übungsanweisungen
- Initialisiere den k-means-Algorithmus. Setze
random_stateauf42, damit der Code reproduzierbar ist. - Berechne die Abstände zu den Clusterzentren, um Ausreißer als Differenz zwischen den
dataund den zugehörigen Clusterzentren zu identifizieren.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)