1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Segmentace zákazníků

V tomto cvičení provedeš segmentaci zákazníků z datasetu Mall Customer Segmentation pomocí clusteringového modelu s diferenciálním soukromím.

V K-means clusteringu můžeš určit optimální počet clusterů pomocí metody lokte (elbow method).

Resulting graphic from Elbow method with non-private model
Z výsledného grafu si všimni, že optimální počet clusterů je 5. Budeš clusterovat podle Annual Income a Spending Score, které jsou načteny jako X, a vykreslíš výsledné clustery.

Celý dataset je načten jako mall_df. Pro usnadnění práce máš k dispozici vlastní funkci show_clusters() pro vizualizaci clusterů. Více se o ní dozvíš pomocí ?show_clusters.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Inicializuj privátní clusteringový model s 5 clustery.