1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Segmentacja klientów

W tym ćwiczeniu przeprowadzisz segmentację klientów na podstawie zbioru danych Mall Customer Segmentation, korzystając z modelu grupowania z prywatnością różnicową.

W grupowaniu K-średnich optymalną liczbę klastrów można wyznaczyć metodą łokcia.

Resulting graphic from Elbow method with non-private model
Z wykresu wynika, że optymalna liczba klastrów wynosi 5. Grupowanie przeprowadzisz na podstawie kolumn Annual Income i Spending Score, które zostały wczytane jako X, a następnie zwizualizujesz otrzymane klastry.

Pełny zbiór danych został wczytany jako mall_df. Dla wygody udostępniono ci niestandardową funkcję show_clusters() do wizualizacji klastrów. Użyj ?show_clusters, aby dowiedzieć się więcej.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Zainicjalizuj prywatny model grupowania, ustawiając 5 klastrów.