Aan de slagGa gratis aan de slag

Klanten segmenteren

In deze oefening voer je een klantensegmentatie uit op de Mall Customer Segmentation Dataset met een differentieel privé-clusteringmodel.

Bij K-means-clustering kun je het optimale aantal clusters bepalen met de elbow-methode.

Resulterende grafiek van de elbow-methode met niet-privémodel
Uit de resulterende grafiek blijkt dat het optimale aantal clusters 5 is. Je clustert op basis van Annual Income en Spending Score, die zijn geladen als X, en je plot de resulterende clusters.

De volledige gegevensset is geladen als mall_df. Voor het gemak is een aangepaste functie show_clusters() meegeleverd om de clusters te plotten. Gebruik ?show_clusters om er meer over te leren.

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build the differentially private K-means model
model = ____
Code bewerken en uitvoeren