1. Обучение
  2. /
  3. Курса
  4. /
  5. Analiza clusterelor în Python

Connected

упражнение

K-means clustering: primul exercițiu

Acest exercițiu te va familiariza cu utilizarea algoritmului k-means clustering pe un set de date. Vom folosi setul de date Comic Con pentru a vedea cum funcționează k-means clustering pe el.

reamintește-ți cei doi pași ai algoritmului k-means clustering:

  • Definește centrele de cluster prin funcția kmeans(). Aceasta are două argumente obligatorii: observațiile și numărul de clustere.
  • Atribuie etichetele de cluster prin funcția vq(). Aceasta are două argumente obligatorii: observațiile și centrele de cluster.

Datele sunt stocate într-un DataFrame pandas, comic_con. x_scaled și y_scaled sunt numele coloanelor cu coordonatele X și Y standardizate ale persoanelor la un moment dat.

Инструкции

100 XP
  • Importă funcțiile kmeans și vq din SciPy.
  • Generează centrele de cluster folosind funcția kmeans() cu două clustere.
  • Creează etichetele de cluster folosind aceste centre de cluster.