Uitschieters in kredietgegevens visualiseren
Je ontdekte uitschieters in person_emp_length waarbij waarden groter dan 60 ver boven de norm lagen. person_age is nog een kolom waarbij je met gezond verstand kunt zeggen dat het zeer onwaarschijnlijk is dat iemand die een lening aanvraagt ouder is dan 100 jaar.
De gegevens hier visualiseren is een makkelijke extra manier om uitschieters op te sporen. Je kunt andere numerieke kolommen zoals loan_amnt en loan_int_rate gebruiken om grafieken met person_age te maken en zo naar uitschieters te zoeken.
De gegevensset cr_loan is al in de werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the scatter plot for age and amount
plt.scatter(____[____], ____[____], c='blue', alpha=0.5)
plt.xlabel("Person Age")
plt.ylabel("Loan Amount")
plt.____()