1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Clustering ierarhic aglomerativ

În exercițiul anterior, ai văzut cum numărul de clustere în cadrul algoritmului K-means poate influența rezultatele, pregătindu-te astfel să discuți despre K-means într-un interviu de machine learning. Un alt model de clustering pe care îl poți folosi este clustering-ul ierarhic aglomerativ. În Python, poți determina numărul optim de clustere pentru această tehnică atât vizual, cât și matematic. Vei folosi modulele scipy și sklearn pentru ambele abordări.

Reține că selectarea numărului optim de clustere dintr-un dendrogram depinde atât de criteriul de legătură, cât și de pragul de distanță. Vei crea un dendrogram folosind matricea X din setul de date diabetes, după care vei trasa o linie imaginară la înălțimea 1,50, numărând liniile verticale intersectate pentru a determina numărul optim de clustere pentru algoritmul de clustering ierarhic.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Importă pachetele necesare pentru a crea un dendrogram și a efectua clustering ierarhic aglomerativ.