Drempelwaarde kiezen
Je weet dat er een afweging is tussen statistieken zoals default recall, non-default recall en modelnauwkeurigheid. Een eenvoudige manier om een goede startdrempel te benaderen is door een grafiek van alle drie te bekijken met matplotlib. Met deze grafiek zie je hoe elk van deze statistieken eruitziet terwijl je de drempelwaarden aanpast, en vind je het punt waarop de prestaties van alle drie goed genoeg zijn om te gebruiken voor de kredietdata.
De drempelwaarden thresh, default recall-waarden def_recalls, de non-default recall-waarden nondef_recalls en de nauwkeurigheidsscores accs zijn in de werkruimte geladen. Om de grafiek leesbaarder te maken, is ook de array ticks voor de x-as-tickaanduidingen geladen.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
plt.plot(____,____)
plt.plot(____,____)
plt.plot(____,____)
plt.xlabel("Probability Threshold")
plt.xticks(ticks)
plt.legend(["Default Recall","Non-default Recall","Model Accuracy"])
plt.____()