Séparer les prix des maisons avec l’ACP
L’ACP et t-SNE sont toutes deux des techniques d’extraction de caractéristiques, mais l’ACP ne peut capturer que la structure linéaire des données. Dans cet exercice, vous allez créer un graphique d’ACP sur l’intégralité de house_sales_df afin de comparer son résultat à la sortie de t-SNE.
Rappelez-vous que price est la variable cible dans house_sales_df. Il est important de l’exclure avant d’ajuster l’ACP sur les données.
Les packages tidyverse et ggfortify ont été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Ajustez une ACP sur les prédicteurs de
house_sales_df. - Utilisez
autoplot()pour tracer les deux premières composantes principales et codez le prix par la couleur.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))
# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
scale_color_gradient(low="gray", high="blue")