ComenzarEmpieza gratis

Segmentación de clientes

En este ejercicio, vas a realizar una segmentación de clientes con el conjunto de datos Mall Customer Segmentation usando un modelo de clustering con privacidad diferencial.

En K-means, puedes calcular el número óptimo de clusters con el método del codo.

Gráfico resultante del método del codo con un modelo no privado
A partir del gráfico resultante, observa que el número óptimo de clusters es 5. Harás el clustering en función de Annual Income y Spending Score, que se han cargado como X, y representarás los clusters resultantes.

El conjunto de datos completo se ha cargado como mall_df. Para tu comodidad, se te proporciona una función personalizada show_clusters() para trazar los clusters. Usa ?show_clusters para saber más.

Este ejercicio forma parte del curso

Privacidad de datos y anonimización en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Build the differentially private K-means model
model = ____
Editar y ejecutar código