1. 학습
  2. /
  3. 강의
  4. /
  5. Analiza skupień w R

Connected

연습 문제

Wpływ skali

Wiesz już, że gdy jedna zmienna ma znacznie większą skalę niż pozostałe zmienne w zbiorze danych, może nieproporcjonalnie wpływać na obliczone odległości między obserwacjami. Przekonaj się o tym na przykładzie próbki danych ze zbioru trees.

Wykorzystasz funkcję scale(), która domyślnie centruje i skaluje cechy w kolumnach.

Zmienne w zbiorze danych to:

  • Girth – średnica drzewa w calach
  • Height – wysokość drzewa w calach

지침

100 XP
  • Oblicz macierz odległości dla ramki danych three_trees i zapisz ją jako dist_trees.
  • Utwórz nową zmienną scaled_three_trees, w której dane z three_trees są wycentrowane i wyskalowane.
  • Oblicz i wyświetl macierz odległości dla scaled_three_trees, zapisując ją jako dist_scaled_trees.
  • Wyświetl obie macierze – dist_trees i dist_scaled_trees – i zwróć uwagę, jak zmieniły się pary obserwacji o najmniejszej odległości (podpowiedź: te pary uległy zmianie).