1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

ćwiczenie

Ostatnie drzewo z dodatkowymi opcjami

W tym ćwiczeniu użyjesz kilku dodatkowych argumentów omówionych w lekcji wideo. Zmienisz niektóre ustawienia w funkcji rpart.control() oraz dodasz wagi za pomocą argumentu weights w funkcji rpart(). Wektor case_weights został już przygotowany i wczytany do twojego środowiska. Zawiera on wagi równe 1 dla obserwacji bez niewykonania zobowiązania w zbiorze treningowym oraz wagi równe 3 dla obserwacji z niewykonaniem zobowiązania. Przypisując wyższe wagi do niewykonania zobowiązania, model będzie przykładał większą wagę do poprawnej klasyfikacji takich przypadków.

Instrukcje

100 XP
  • Ustaw ziarno losowości na 345.
  • Uzupełnij podany kod, przekazując case_weights do argumentu weights funkcji rpart().
  • Zmień minimalną liczbę podziałów dozwolonych w węźle na 5, a minimalną liczbę obserwacji w węzłach liściowych na 2 – użyj do tego argumentów minsplit i minbucket w rpart.control.
  • Użyj funkcji plotcp(), aby sprawdzić, gdzie można zminimalizować błąd kroswalidacyjny.
  • Użyj which.min(), aby znaleźć wiersz z minimalną wartością "xerror" w tree_weights$cp. Przypisz wynik do zmiennej index.
  • Użyj podanego kodu, aby wybrać wartość cp, przy której błąd kroswalidacyjny jest minimalny.
  • Przytnij drzewo, korzystając z parametru złożoności minimalizującego błąd kroswalidacyjny. Zapisz przycięte drzewo w zmiennej ptree_weights.
  • Narysuj przycięte drzewo za pomocą funkcji prp(). Dodaj drugi argument extra i ustaw go na 1.