1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Histogramy

Datová sada loan_data je načtena v tvém pracovním prostředí. Kategorické proměnné jsi už prozkoumal/a pomocí funkce CrossTable(). Teď se zaměříme na spojité proměnné, abychom odhalili případné odlehlé hodnoty nebo neočekávané struktury v datech.

Vyzkoušejme funkci hist() a prozkoumejme rozložení počtu půjček pro různé zákazníky.

Pokyny

100 XP
  • Pomocí hist() vytvoř histogram s jediným argumentem: loan_data$loan_amnt. Výsledek ulož do nového objektu s názvem hist_1.
  • Pomocí $breaks a objektu hist_1 zjisti více informací o hranicích histogramu. Poloha hranic je důležitá – pokud jsou zvoleny nevhodně, histogram může být zavádějící.
  • Změň počet hranic v hist_1 na 200 zadáním argumentu breaks. Pojmenuj také osu x hodnotou "Loan amount" pomocí argumentu xlab a nastav název grafu na "Histogram of the loan amount" pomocí argumentu main. Výsledek ulož do hist_2. Proč se vrcholy nacházejí právě tam, kde jsou?