1. Learn
  2. /
  3. Courses
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

Exercise

Kódování kategorických příznaků

Někdy dataset obsahuje číselné hodnoty, které představují kategorický příznak.

V datasetu donors používá proměnná wealth_rating čísla k vyjádření úrovně bohatství dárce:

  • 0 = Neznámá
  • 1 = Nízká
  • 2 = Střední
  • 3 = Vysoká

Toto cvičení ukazuje, jak takový kategorický příznak připravit, a zkoumá jeho vliv na model logistické regrese. K dispozici máš datový rámec donors.

Instructions

100 XP
  • Vytvoř faktor wealth_levels z číselné proměnné wealth_rating s popisky uvedenými níže – předej funkci factor() sloupec, který chceš převést, jednotlivé úrovně a popisky.
  • Pomocí relevel() změň referenční kategorii na Medium. Prvním argumentem by měl být tvůj nový sloupec typu factor.
  • Sestav model logistické regrese, který pomocí sloupce wealth_levels předpovídá donated, a zobraz výsledek pomocí summary().