1. Learn
  2. /
  3. Kurser
  4. /
  5. Oövervakad inlärning i Python

Connected

övning

Den första huvudkomponenten

Den första huvudkomponenten i en datamängd är den riktning där datan varierar mest. I den här övningen ska du använda PCA för att hitta den första huvudkomponenten för längd- och breddmätningarna av sädeskornen, och sedan visualisera den som en pil i ett spridningsdiagram.

Arrayen grains innehåller längd och bredd för sädeskornssamplarna. PyPlot (plt) och PCA har redan importerats åt dig.

Instruktioner

100 XP
  • Skapa ett spridningsdiagram över sädeskornsdata. Det här steget är redan gjort åt dig.
  • Skapa en instans av PCA med namnet model.
  • Anpassa modellen till grains-datan.
  • Extrahera koordinaterna för datans medelvärde med attributet .mean_ från model.
  • Hämta den första huvudkomponenten från model med attributet .components_[0,:].
  • Rita den första huvudkomponenten som en pil i spridningsdiagrammet med funktionen plt.arrow(). Du behöver ange de två första argumenten – mean[0] och mean[1].