1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w R

Connected

ćwiczenie

Wykonywanie PCA

Kolejnym krokiem analizy jest wykonanie PCA na zbiorze wisc.data.

W poprzednim rozdziale przekonałeś się, że przed wykonaniem PCA warto sprawdzić, czy dane wymagają skalowania. Przypomnij sobie dwa najczęstsze powody skalowania danych:

  1. Zmienne wejściowe są wyrażone w różnych jednostkach miary.
  2. Zmienne wejściowe mają znacząco różne wariancje.

Instrukcje

100 XP

Zmienne utworzone wcześniej – wisc.data i diagnosis – są nadal dostępne w twoim środowisku pracy.

  • Sprawdź średnią i odchylenie standardowe cech w zbiorze danych, aby zdecydować, czy dane powinny być skalowane. Użyj funkcji colMeans() i apply(), tak jak robiłeś to wcześniej.
  • Wykonaj PCA na zbiorze wisc.data, skalując dane, jeśli to konieczne, i przypisz model do zmiennej wisc.pr.
  • Przejrzyj podsumowanie wyników za pomocą funkcji summary().