K-means para agrupar feedback
Tienes un conjunto de datos de respuestas de feedback y has usado un modelo GPT para calcular puntuaciones de confianza para cada respuesta. Para identificar feedback inusual o atípico, aplicas k-means a las respuestas con baja confianza.
El algoritmo KMeans, las variables reviews y confidences, y la librería np ya están precargados.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Instrucciones del ejercicio
- Inicializa el algoritmo k-means. Establece
random_stateen42para garantizar la reproducibilidad del código. - Calcula las distancias desde los centros de los clústeres para identificar outliers como la diferencia entre
datay los centros de clúster correspondientes.
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)