1. Learn
  2. /
  3. Cursuri
  4. /
  5. Segmentarea clienților în Python

Connected

exercițiu

Calculează și reprezintă grafic suma pătratelor erorilor

Acum vei calcula suma pătratelor erorilor pentru diferite numere de clustere, de la 1 la 10.

Vei folosi datele RFMT normalizate create în exercițiul anterior, stocate ca datamart_rfmt_normalized. Modulul KMeans din scikit-learn este deja importat. De asemenea, am inițializat un dicționar gol pentru a stoca suma pătratelor erorilor: sse = {}.

Explorează datele în consolă dacă dorești.

Instrucțiuni

100 XP
  • Inițializează KMeans cu k clustere și random state 1, apoi aplică KMeans pe setul de date normalizat.
  • Atribuie suma pătratelor distanțelor elementului k din dicționarul sse.
  • Adaugă titlul graficului „The Elbow Method", eticheta axei X „k" și eticheta axei Y „SSE".
  • Reprezintă grafic valorile SSE pentru fiecare k stocat ca cheie în dicționar.