ComenzarEmpieza gratis

K-means para agrupar feedback

Tienes un conjunto de datos de respuestas de feedback y has usado un modelo GPT para calcular puntuaciones de confianza para cada respuesta. Para identificar feedback inusual o atípico, aplicas k-means a las respuestas con baja confianza.

El algoritmo KMeans, las variables reviews y confidences, y la librería np ya están precargados.

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Instrucciones del ejercicio

  • Inicializa el algoritmo k-means. Establece random_state en 42 para garantizar la reproducibilidad del código.
  • Calcula las distancias desde los centros de los clústeres para identificar outliers como la diferencia entre data y los centros de clúster correspondientes.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def detect_anomalies(data, n_clusters=3):
    # Initialize k-means
    ____
    clusters = kmeans.fit_predict(data)
    centers = kmeans.cluster_centers_

    # Calculate distances from cluster centers
    ____
    return distances
  
anomalies = detect_anomalies(confidences)
print(anomalies)
Editar y ejecutar código