K-means para agrupar feedback
Tienes un conjunto de datos de respuestas de feedback y has usado un modelo GPT para calcular puntuaciones de confianza para cada respuesta. Para identificar feedback inusual o atípico, aplicas k-means a las respuestas con baja confianza.
El algoritmo KMeans, las variables reviews y confidences, y la librería np ya están precargados.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Instrucciones del ejercicio
- Inicializa el algoritmo k-means. Establece
random_stateen42para garantizar la reproducibilidad del código. - Calcula las distancias desde los centros de los clústeres para identificar outliers como la diferencia entre
datay los centros de clúster correspondientes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def detect_anomalies(data, n_clusters=3):
# Initialize k-means
____
clusters = kmeans.fit_predict(data)
centers = kmeans.cluster_centers_
# Calculate distances from cluster centers
____
return distances
anomalies = detect_anomalies(confidences)
print(anomalies)