1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Dimenzionalita a informační obsah příznaků

Představ si, že pracuješ v bance a máš k dispozici informace o různých půjčkách poskytnutých různým lidem. Tvůj nadřízený tě požádal, abys začal/a zkoumat možnost využít tato data ke klasifikaci zákazníků do různých kategorií kreditního skóre. Ukázka dostupných dat je načtena do credit_df. Zajímá tě, kolik příznaků data obsahují, a chceš také identifikovat příznaky, které pro klasifikaci zákazníků nebudou užitečné.

Balíček tidyverse je pro tebe již načtený.

Pokyny

100 XP
  • Zjisti počet příznaků v credit_df.
  • Vypočítej rozptyl každého příznaku v credit_df.
  • Identifikuj příznak s nulovým rozptylem a přiřaď ho do column_to_remove.