1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

ćwiczenie

Przycinanie drzewa ze zmienionymi prawdopodobieństwami a priori

W lekcji wideo dowiedziałeś się, że przycinanie drzewa jest niezbędne, aby uniknąć przeuczenia. W poprzednich ćwiczeniach pojawiały się duże drzewa – teraz czas zastosować zdobytą wiedzę w praktyce i przyciąć wcześniej zbudowane drzewo ze zmienionymi prawdopodobieństwami a priori. Pakiet rpart jest już wczytany w twoim środowisku.

Na początku ustawisz ziarno losowości, aby wyniki były powtarzalne – jak wspomniano w filmie, ponieważ będziesz analizować wyniki błędu kroswalidacyjnego. Wyniki zawierają element losowości i mogą się nieznacznie różnić przy ponownym uruchomieniu funkcji z innym ziarnem.

W tym ćwiczeniu nauczysz się identyfikować, która wartość parametru złożoności (CP) minimalizuje błąd kroswalidacyjny, a następnie przytniesz drzewo na podstawie tej wartości.

Instrukcje

100 XP
  • tree_prior jest wczytane w twoim środowisku.
  • Użyj plotcp(), aby zwizualizować błąd kroswalidacyjny (X-val Relative Error) w zależności od parametru złożoności dla tree_prior.
  • Użyj printcp(), aby wyświetlić tabelę z informacjami o CP, podziałach i błędach. Sprawdź, czy potrafisz wskazać, który podział ma minimalny błąd kroswalidacyjny w tree_prior.
  • Użyj which.min(), aby znaleźć, który wiersz w tree_prior$cptable ma minimalny błąd kroswalidacyjny "xerror". Wynik przypisz do zmiennej index.
  • Utwórz tree_min, wybierając wartość z tree_prior$cptable pod indeksem index w kolumnie "CP".
  • Użyj funkcji prune(), aby uzyskać przycięte drzewo. Nadaj mu nazwę ptree_prior.
  • Pakiet rpart.plot jest wczytany w twoim środowisku. Wykreśl przycięte drzewo za pomocą funkcji prp() (ustawienia domyślne).