1. Learn
  2. /
  3. Courses
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

Exercise

Histogramy

Zbiór danych loan_data jest wczytany do twojego środowiska pracy. Wcześniej analizowałeś zmienne kategoryczne przy użyciu funkcji CrossTable(). Teraz czas przyjrzeć się zmiennym ciągłym – pomoże to wykryć potencjalne wartości odstające lub nieoczekiwane struktury w danych.

W tym celu poeksperymentujemy z funkcją hist(), aby zbadać rozkład liczby pożyczek dla różnych klientów.

Instructions

100 XP
  • Użyj funkcji hist(), aby utworzyć histogram z jednym argumentem: loan_data$loan_amnt. Przypisz wynik do nowego obiektu o nazwie hist_1.
  • Użyj $breaks na obiekcie hist_1, aby uzyskać więcej informacji o przedziałach histogramu. Znajomość położenia przedziałów jest ważna – jeśli są źle dobrane, histogram może wprowadzać w błąd.
  • Zmień liczbę przedziałów w hist_1 na 200, korzystając z argumentu breaks. Dodatkowo nadaj osi X etykietę "Loan amount" za pomocą argumentu xlab, a całemu wykresowi tytuł "Histogram of the loan amount" za pomocą argumentu main. Zapisz wynik do obiektu hist_2. Zastanów się, dlaczego szczyty pojawiają się akurat w tych miejscach.