1. Learn
  2. /
  3. Courses
  4. /
  5. Reducerea dimensionalității în R

Connected

Exercise

Separarea prețurilor locuințelor cu t-SNE

t-SNE este o tehnică neliniară de reducere a dimensionalității. Aceasta proiectează date de dimensionalitate ridicată într-un spațiu de dimensionalitate mai mică, încercând să păstreze fiecare punct cât mai aproape de vecinii săi originali. Vei crea un grafic t-SNE pe care îl poți compara cu graficul PCA din exercițiul anterior. PCA păstrează structura globală a datelor, însă nu și pe cea locală. t-SNE păstrează structura locală, menținând vecinii din spațiul de dimensionalitate ridicată aproape unii de alții în spațiul de dimensionalitate mai mică. Vei observa acest lucru în grafice.

Vei aplica t-SNE pentru a reduce setul de date house_sales_df. Variabila țintă a setului house_sales_df este price. Pachetele tidyverse și Rtsne au fost deja încărcate pentru tine.

Instructions

100 XP
  • Antrenează t-SNE pe house_sales_df folosind Rtsne().
  • Adaugă coordonatele X și Y ale t-SNE la house_sales_df.
  • Vizualizează rezultatele t-SNE folosind ggplot(), codificând variabila țintă prin culoare.