1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cluster Analysis v R

Connected

Cvičení

Výpočet vzdálenosti mezi kategorickými proměnnými

V tomto cvičení si vyzkoušíš, jak vypočítat binární (Jaccardovu) vzdálenost. Nejdříve je potřeba převést kategorie na dummy proměnné pomocí funkce dummy.data.frame() z knihovny dummies.

Budeš pracovat s malou sadou odpovědí z průzkumu uloženou v datovém rámci job_survey, který obsahuje tyto sloupce:

  • job_satisfaction Možné hodnoty: "Hi", "Mid", "Low"
  • is_happy Možné hodnoty: "Yes", "No"

Pokyny

100 XP
  • Vytvoř dummifikovaný datový rámec dummy_survey.
  • Pomocí funkce dist() s parametrem method = 'binary' vypočítej Jaccardovu matici vzdáleností dist_survey pro dummifikovaná data z průzkumu.
  • Vypiš původní data i matici vzdáleností.
    • Všimni si pozorování s nulovou vzdáleností v původních datech (1, 2 a 3).