1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w R

Connected

ćwiczenie

Kwestie praktyczne: skalowanie

W materiale wideo pokazano, że skalowanie danych przed wykonaniem PCA wpływa na wyniki modelowania. W tym ćwiczeniu przeprowadzisz PCA z zastosowaniem skalowania i bez niego, a następnie zwizualizujesz wyniki za pomocą biplots.

Skalowanie bywa wskazane, gdy wariancje zmiennych znacznie się od siebie różnią. Dzieje się tak często, gdy zmienne mają różne jednostki miary – na przykład stopnie Fahrenheita (temperatura) i mile (odległość). Decyzja o zastosowaniu skalowania to ważny krok w analizie głównych składowych.

Instrukcje

100 XP

W przestrzeni roboczej dostępny jest ten sam zbiór danych Pokemon co wcześniej – jako pokemon – z jedną nową zmienną: Total.

  • Na początku edytora znajdziesz kod obliczający średnią i odchylenie standardowe każdej zmiennej w modelu. Uruchom ten kod, aby zobaczyć, jak bardzo skale zmiennych różnią się w oryginalnych danych.
  • Utwórz model PCA dla pokemon ze skalowaniem i przypisz wynik do pr.with.scaling.
  • Utwórz model PCA dla pokemon bez skalowania i przypisz wynik do pr.without.scaling.
  • Użyj funkcji biplot(), aby zwizualizować oba modele (każdy osobno) i porównać ich wyniki.