1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare nesupervizată în Python

Connected

exercițiu

Prima componentă principală

Prima componentă principală a datelor este direcția în care datele variază cel mai mult. În acest exercițiu, vei folosi PCA pentru a găsi prima componentă principală a măsurătorilor de lungime și lățime ale eșantioanelor de cereale și pentru a o reprezenta ca săgeată pe diagrama de dispersie.

Arrayul grains conține lungimea și lățimea eșantioanelor de cereale. PyPlot (plt) și PCA au fost deja importate pentru tine.

Instrucțiuni

100 XP
  • Creează o diagramă de dispersie a măsurătorilor de cereale. Acest pas a fost deja realizat pentru tine.
  • Creează o instanță PCA numită model.
  • Antrenează modelul pe datele grains.
  • Extrage coordonatele mediei datelor folosind atributul .mean_ al modelului model.
  • Obține prima componentă principală a modelului model folosind atributul .components_[0,:].
  • Reprezintă prima componentă principală ca săgeată pe diagrama de dispersie, folosind funcția plt.arrow(). Trebuie să specifici primele două argumente – mean[0] și mean[1].