1. Apprendre
  2. /
  3. Cours
  4. /
  5. Unsupervised Learning in Python

Connected

Exercice

La première composante principale

La première composante principale des données est la direction dans laquelle les données varient le plus. Dans cet exercice, votre tâche est d'utiliser la PCA pour trouver la première composante principale des mesures de longueur et de largeur des échantillons de grain, puis de la représenter par une flèche sur le nuage de points.

Le tableau grains contient la longueur et la largeur des échantillons de grain. PyPlot (plt) et PCA ont déjà été importés pour vous.

Instructions

100 XP
  • Faites un nuage de points des mesures des grains. Cela a déjà été fait pour vous.
  • Créez une instance de PCA appelée model.
  • Ajustez le modèle aux données grains.
  • Extrayez les coordonnées de la moyenne des données à l'aide de l'attribut .mean_ de model.
  • Récupérez la première composante principale de model avec l'attribut .components_[0,:].
  • Tracez la première composante principale sous forme de flèche sur le nuage de points à l'aide de la fonction plt.arrow(). Vous devez préciser les deux premiers arguments : mean[0] et mean[1].