1. Nauka
  2. /
  3. Kursy
  4. /
  5. Algebra liniowa dla data science w R

Connected

ćwiczenie

Podsumowanie PCA w R

Jak pokazano w filmie, w naszych danych znajdowała się zmienna kategoryczna (pozycja), która wyraźnie grupowała obserwacje w przestrzeni dwóch pierwszych głównych składowych. Nawet po przeskalowaniu danych te dwie składowe wyjaśniają dużą część wariancji. Co się stanie, jeśli przeanalizujemy dane tylko dla jednej pozycji naraz?

Instrukcje

100 XP

Wykonaj taką samą analizę jak w poprzednim ćwiczeniu, ale ogranicz dane do podzbioru, w którym pozycja to "WR" (wide receiver):

  • Użyj funkcji scale(), aby przeskalować kolumny od 5. do 12. z danych combine_WR. Nazwij tę ramkę danych B i wyświetl jej fragment za pomocą head().
  • Użyj prcomp(), aby przeprowadzić analizę głównych składowych na tych danych, a następnie podsumuj wyniki za pomocą summary().