CommencerCommencer gratuitement

Séparer les prix des maisons avec l’ACP

L’ACP et t-SNE sont toutes deux des techniques d’extraction de caractéristiques, mais l’ACP ne peut capturer que la structure linéaire des données. Dans cet exercice, vous allez créer un graphique d’ACP sur l’intégralité de house_sales_df afin de comparer son résultat à la sortie de t-SNE.

Rappelez-vous que price est la variable cible dans house_sales_df. Il est important de l’exclure avant d’ajuster l’ACP sur les données.

Les packages tidyverse et ggfortify ont été chargés pour vous.

Cet exercice fait partie du cours

Réduction de dimension en R

Afficher le cours

Instructions

  • Ajustez une ACP sur les prédicteurs de house_sales_df.
  • Utilisez autoplot() pour tracer les deux premières composantes principales et codez le prix par la couleur.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))

# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Modifier et exécuter le code