Kruistabel- en draaitabellen
Financiële gegevens worden vaak bekeken als draaitabellen in spreadsheets zoals Excel.
Met kruistabellen krijg je een overzicht op hoog niveau van geselecteerde kolommen en zelfs aggregaties zoals een telling of gemiddelde. Voor de meeste kredietrisicomodellen, vooral voor probability of default, zijn kolommen zoals person_emp_length en person_home_ownership gebruikelijk om mee te beginnen.
Je kunt zien hoe de waarden in de hele gegevensset zijn verdeeld en ze visualiseren. Voor nu controleer je hoe loan_status wordt beïnvloed door factoren zoals woonsituatie (home ownership), leningklasse (loan grade) en het leenpercentage van het inkomen.
De gegevensset cr_loan is in de werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a cross table of the loan intent and loan status
print(pd.____(cr_loan[____], cr_loan[____], margins = True))