1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie statystycznych pytań rekrutacyjnych w R

Connected

ćwiczenie

PCA – redukcja wymiarów

W poprzednim ćwiczeniu pracowałeś na zbiorze danych z dwiema zmiennymi. Na rozmowie kwalifikacyjnej prawdopodobnie spotkasz się z większym zbiorem danych.

PCA pozwala zmniejszyć liczbę zmiennych bez istotnej utraty wartości informacyjnej.

PCA zwraca zbiór danych tego samego rozmiaru co oryginalny. To ty decydujesz, ile zmiennych zachować!

Następujące parametry funkcji prcomp() redukują wymiary na podstawie:

  • tol – odchylenie standardowe jako odsetek odchylenia standardowego pierwszego składnika,
  • rank – maksymalna liczba składników.

Zbiór danych letters zawiera numeryczne atrybuty liter.

Instrukcje 1/3

undefined XP
  • 1

    Wyznacz główne składowe i sprawdź, jaki udział wariancji wyjaśnia każdy z nich.

  • 2

    Pomiń składowe, których odchylenie standardowe jest mniejsze niż 0,25 odchylenia standardowego pierwszego składnika.

  • 3

    Ogranicz liczbę głównych składowych do 7.